zhangjunpeng的个人博客分享 http://blog.sciencenet.cn/u/zhangjunpeng

博文

miRNA TissueAtlas 2025:处理和注释人和小鼠非编码RNA组织图谱

已有 508 次阅读 2024-12-16 10:07 |个人分类:科普|系统分类:科普集锦

miRNA TissueAtlas 2025:处理和注释人和小鼠非编码RNA组织图谱

非编码RNA,如miRNA对组织中蛋白质表达水平的调控至关重要。miRNA是非编码RNA中研究最多的一类,在大小、生物发生、靶向机制和下游功能方面与其他小非编码RNA不同。它们是21-23个短序列,针对哺乳动物mRNA3UTR与它们结合并降解它们或破坏它们的翻译。miRNA家族可以有超过400个这样的靶向调控,这些调控关系是进化保守的。这些调控关系可导致整个通路的上调或下调,使其作为与疾病研究相关的药物靶点或生物标志物。MiRNA序列本身也是进化保守的。三分之二已知的miRNA在大型灵长类动物(如人类和小鼠)之间是相似的。在物种间分化的miRNA可以承担物种特有的功能。例如,最近进化的智人miRNA被证明能够丰富神经元功能,暗示miRNA可能在人类智力爆炸中发挥作用。miRNA的序列变化,即使是在单个碱基对上,也可以产生isomiR(同分异构体),它可以改变其下游靶向,例如通过种子转移,并产生新的功能。如果这些功能被证明是适应性的,这些isomiR可以经历自然选择,在一个物种中固定下来,并随着时间的推移产生新的miRNAisomiR生物发生也可以发生在其他条件下,也与疾病研究有关,特别是在癌症中得到了充分研究。MiRNA仅从核基因组转录,但定位于细胞质和线粒体亚细胞区室。这与其他非编码RNA(如rRNAtRNA)形成对比,后者在细胞核和线粒体基因组上都有拷贝。tRNA的加工也可以在细胞质和线粒体中产生tRF,这是一类新兴的非编码RNA,以前与miRNA混淆。此外,几乎无处不在的miRNA为合成生物学中调节基因剂量提供了一个实用的工具,提供了对基因表达的精确控制,这与mRNA医学和基因治疗的兴起越来越相关。miRNA的失调已被应用于诸如帕金森氏病或阿尔茨海默病等疾病中。除了病理机制,在人类中,miRNA还参与生理过程,如衰老。

miRNA在调节组织的转录组学特征中所起的作用反过来暗示了组织特异性表达。事实上,这最初是在Landgraf等人的里程碑式研究中观察到的,并为2016年第一代miRNATissueAtlas提供了灵感。虽然它被研究界广泛使用,但微阵列技术的使用将其限制在已知的miRNA上,并禁止了对isomiR的探索。这促使在2022年生成miRNATissueAtlas的下一个迭代及其专用的isomiRDB。使用第二代NGS(下一代测序),进一步扩大了收集到更多的组织,包括小黄鼠。使用高质量的供体匹配组织,不仅可以探索已建立的和新miRNA的组织特异性,还可以探索其他九类非编码RNA的组织特异性。包括小鼠能够确定这种组织特异性分布在物种之间是保守的,同源miRNA具有高度相关的组织特异性指数。这表明miRNA的组织特异性在进化上是保守的,因此对组织功能至关重要。

由于它们对组织功能和疾病的重要性,非编码RNA的测序数据正以指数速度增长。根据NCBI SRAhttps://www.ncbi.nlm.nih.gov/SRA)的统计数据,此类公开可用数据集的总数已从2022年的27,331个增加到2024年的46,468个。尽管数据增长迅速,但我们对整体非编码RNA表达的了解仍远未完成。作为提高这一认识的来源,miRNA表达数据的图谱水平资源不断出现。值得注意的例子包括人类细胞系microRNAomeDIANA-miTEDisomiRdbmiSRA。其他图谱包括FANTOM项目的子部分和免疫学基因组联盟,两者都以其多组学方法而闻名。然而,到目前为止,从目前公开的测序数据集中,尚缺乏一种用于生理组织、细胞系和细胞外囊泡的不同类别的非编码RNA整合资源。 

miRNATissueAtlas以前的高质量标签库代表了一个完美的框架,现在可以添加包含7990亿个读数的61,593个样本,并以统一的方式对它们进行注释。该更新资源命名为miRNATissueAtlas 2025(图1https://www.ccb.uni-saarland.de/tissueatlas2025),而不是遵循之前的命名模式。通过添加年份来摆脱传统版本的编号可能有助于研究人员立即衡量他们正在使用的资源的近代性。

image.png 1 miRNATissueAtlas 2025框图

miRNATissueAtlas 2025有两个局限性。首先,虽然组织和器官元数据标签是统一的,但它们绝不是对进行实验条件的完整描述。该图谱代表了所有公开可用的miRNA测序实验的全部表达数据。这包括疾病、基因敲除、过表达实验、不同年龄、性别等条件。在bulk数据中,器官同一性的影响通常忽略这些影响。然而,它们引入了异质性,在使用数据时必须牢记这一点。第二是标签的不平衡性。如前所述,进行实验的逻辑性和实用性显著影响样本的来源。如果不加以考虑,数据集的这一属性可能会使分析结果产生偏差。最后并非最不重要的,实验偏差,如使用不同的测序方案可能会对结果产生重大影响。另一种偏见是对小鼠和人的限制。随着越来越多的数据集可以用于其他物种,有助于获得更多关于miRNA组织特异性的见解,以及它是否在其他物种之间也具有进化保守性。

参考文献

[1] Rishik S, Hirsch P, Grandke F, Fehlmann T, Keller A. miRNATissueAtlas 2025: an update to the uniformly processed and annotated human and mouse non-coding RNA tissue atlas. Nucleic Acids Res. 2024 Nov 14:gkae1036. doi: 10.1093/nar/gkae1036.  

以往推荐如下:

1. 分子生物标志物数据库MarkerDB

2. 细胞标志物数据库CellMarker 2.0

3. 细胞发育轨迹数据库CellTracer

4. 人类细胞互作数据库:CITEdb

5. EMT标记物数据库:EMTome

6. EMT基因数据库:dbEMT

7. EMT基因调控数据库:EMTRegulome

8. RNA与疾病关系数据库:RNADisease v4.0

9. RNA修饰关联的读出、擦除、写入蛋白靶标数据库:RM2Target

10. 非编码RNA与免疫关系数据库:RNA2Immune

11. 值得关注的宝藏数据库:CNCB-NGDC

12. 免疫信号通路关联的调控子数据库:ImmReg

13. 利用药物转录组图谱探索中药药理活性成分平台:ITCM

14. AgeAnno:人类衰老单细胞注释知识库

15. 细菌必需非编码RNA资源:DBEncRNA

16. 细胞标志物数据库:singleCellBase

17. 实验验证型人类miRNA-mRNA互作数据库综述

18. 肿瘤免疫治疗基因表达资源:TIGER

19. 基因组、药物基因组和免疫基因组水平基因集癌症分析平台:GSCA

20. 首个全面的耐药性信息景观:DRESIS

21. 生物信息资源平台:bio.tools

22. 研究资源识别门户:RRID

23. 包含细胞上下文信息的细胞互作数据库:CCIDB

24. HMDD 4.0miRNA-疾病实验验证关系数据库

25. LncRNADisease v3.0lncRNA-疾病关系数据库更新版

26. ncRNADrug:与耐药和药物靶向相关的实验验证和预测ncRNA

27. CellSTAR:单细胞转录基因组注释的综合资源

28. RMBase v3.0RNA修饰的景观、机制和功能

29. CancerProteome:破译癌症中蛋白质组景观资源

30. CROST:空间转录组综合数据库

31. FORGEdb:候选功能变异和复杂疾病靶基因识别工具

32. Open-ST3D高分辨率空间转录组学

33. CanCellVar:人类癌症单细胞变异图谱数据库

34. dbCRAF:人类癌症中放射治疗反应调控知识图谱

35. DDID:饮食-药物相互作用综合资源可视化和分析

36. SCancerRNA:肿瘤非编码RNA生物标志物的单细胞表达与相互作用资源

image.png

 



https://blog.sciencenet.cn/blog-571917-1464501.html

上一篇:PRONA:患者报告结果网络分析
下一篇:多组学动态网络生物标志物算法预测肺腺癌器官特异性转移
收藏 IP: 39.128.48.*| 热度|

0

该博文允许注册用户评论 请点击登录 评论 (0 个评论)

1/0 | 总计:0 | 首页 | 上一页 | 跳转

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-12-30 23:50

Powered by ScienceNet.cn

Copyright © 2007-2024 中国科学报社

返回顶部