• 全国 [切换]
  • 二维码
    奥展网

    手机WAP版

    手机也能找商机,信息同步6大终端平台!

    微信小程序

    微信公众号

    当前位置: 首页 » 行业新闻 » 热点新闻 » 正文

    快速上手Cellranger

    放大字体  缩小字体 发布日期:2024-11-09 21:44:02   浏览次数:4  发布人:d01b****  IP:124.223.189***  评论:0
    导读

    Cell Ranger Cell Ranger是用于10x单细胞转录组数据处理一套Linux工具集,包含数据比对,生成表达矩阵,聚类分析和图形可视化等多个功能。一般用cell ranger进行上游分析。 官网:https://www.10xgenomics.com/support/software/cell-ranger/latest 由于测序仪器的测序能力远大于测试样本序列量,为避免仪器浪费,因

    Cell Ranger

    Cell Ranger是用于10x单细胞转录组数据处理一套Linux工具集,包含数据比对,生成表达矩阵,聚类分析和图形可视化等多个功能。一般用cell ranger进行上游分析。

    官网:https://www.10xgenomics.com/support/software/cell-ranger/latest

    由于测序仪器的测序能力远大于测试样本序列量,为避免仪器浪费,因此一个lane同时测定多个样品成为很自然的思路。然而为了区分多种样品的序列,就必须要给不同样品加上特定的“标签”,从而可以在后续数据分析时将不同样品数据分开,而这个“标签”就是barcode。10xBarcode是一段16nt的核苷酸序列(序列空间350万),在每一个Gel Beads中的Barcode序列都是一致的,在后面Barcode与细胞融合形成水凝珠之后,可以保证一个细胞的所有基因序列都带着相同的Barcode序列,也就可以认定这些序列来自同一个细胞。所以我们通常说Barcode序列是用来标记细胞的。Cellranger主要就是用于区分barcode的识别与所连reads的定量。

    UMI(unique molecular identifier分子标签)

    UMI是一段12nt的核苷酸序列(序列空间100万),但与Barcode序列不同的是,一个Gel Beads中UMI序列是不同的。UMI序列的空间很大,远多于需要检测的原始细胞的mRNA数量,(即使一种mRNA有多条,也是达不到UMI的序列空间的)。所以每一条mRNA都会带上一个独特的UMI。UMI的最大作用是去重和绝对定量。

    可以这样理解:barcode是每个凝胶微珠的身份证号码;UMI是每个DNA标签分子的身份证号码

    软件下载

    mkdir cellranger #在目标路径下新建文件夹cd cellranger#下载软件wget -O cellranger-8.0.0.tar.gz "https://cf.10xgenomics.com/releases/cell-exp/cellranger-8.0.0.tar.gz?Expires=1714073771&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA&Signature=CHmp~VHwcV2qCWGIk-wiR-LIT2FVFVny09DXCrksxPRGxI8llh6N87Z2kd4RQin5TH57AlpIjfh5iMdDw54pB3u7oMzANtgdQLd1AUA8FlPzikAvW6Kv02yCwvlpiGnFUwzYnr3aJuATgdgOJLT6RGJumRGt2PQVim45u1jkJ~DeahmRIuntllk8QJ4sOIHqAPvYoPTQ47NN5HXlqMIbw1K8-W7SHMTIXJ4PDudwblqf6xCJltxcLob1P2vD9nwutSsJrdvyaEblv1ZjPGFg5fXkw0Yk8H0He4MRGdhxDTLRgP2~Svneje4yglVQCu~Xe5Yd-UybpW6mhHiTx0GFdg__"#解压tar -zxvf cellranger-8.0.0.tar.gz#添加环境量export PATH=./path/cellranger/cellranger-8.0.0:$PATH#进入cellrangercellranger

    成功后返回如下:




    1.webp (1).jpg

    常用命令-mkgtf&mkref 建立索引文件

    GTF文件(共9列):是对基因组进行注释的

    mkgtf:Raw gtf—mkgtf—filtered gtf,从网上下载的GTF文件几乎包含所有基因,可以利用此命令将不需要的信息过滤掉。

    常用命令-mkfastq 格式转换

    可以用cellranger mkfastq将BCL格式文件转换为fastq文件。

    BCL:测序仪得到的初始格式(测序公司才用的到,普通用户用不到)。

    注意:在定量之前,必须先将格式按照要求修改,cell range对格式要求严格,正确格式如下:

    [Sample Name]_S1_L00[Lane Number]_[Read Type]_001.fastq.gzRead Type:T1:Sample index read(optional)T2:Sample index read(optional)R1:Read1R2:Read2eg:Test_S1_L001_R1_001.fastq.gzTest_S1_L001_R2_001.fastq.gz

    常用命令-count:对原始数据进行比对定量,最后得到基因-细胞的表达矩阵




    2.webp.jpg

    语法:

    cellranger count--id #输出目录名 --transcriptome #基因组索引文件路径 --fastqs #FASTQ数据存放路径 --sample #需要运行的样本名称 --include-introns #定量时是否包含内含子(7.0版本默认为True) #下面非必选项 --lanes #指定lane编号 --no-bam #不输出Bam文件 --nosecondary #不进行下游分析(仅定量) --ocalcores #指定最大核心数 --localmem #指定最大内存(GB)

    例如:

    cellranger count--id sample_test --transcriptome /home/wangyan/cellranger/refdata-gex-GRCh38-2020-A --fastqs /home/wangyan/cellranger/sample_fastqs --sample Sample_1 --include-introns false

    如果运行成功会出现以下这串代码:




    3.webp.jpg

    输出的文件包括以下内容:




    4.webp.jpg

    其中的reanalyze input文件可以用于下游的Seurat分析。

    如果在前面的命令中设置了--nosecondary fasle,则cellranger不进行进一步下游分析:




    5.webp.jpg

     
    (文/匿名(若涉版权问题请联系我们核实发布者) / 非法信息举报 / 删稿)
    打赏
    免责声明
    • 
    本文为昵称为 d01b**** 发布的作品,本文仅代表发布者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,发布者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们154208694@qq.com删除,我们积极做(权利人与发布者之间的调停者)中立处理。郑重说明:不 违规举报 视为放弃权利,本站不承担任何责任!
    有个别老鼠屎以营利为目的遇到侵权情况但不联系本站或自己发布违规信息然后直接向本站索取高额赔偿等情况,本站一概以诈骗报警处理,曾经有1例诈骗分子已经绳之以法,本站本着公平公正的原则,若遇 违规举报 我们100%在3个工作日内处理!
    0相关评论
     

    (c)2008-现在 All Rights Reserved.