TBtools | 基因序列ID简化、重命名及添加前缀

TBtools | 基因序列ID简化、重命名及添加前缀

你是否遇到过基因原始序列ID太长,包含太多不需要的信息,那么我们该如何对原始序列ID进行操作来加速我们的数据分析呢?

如果你有这方面的困扰,那么本期讲解的TBtools序列工具中的基因序列ID处理工具,相信一定会对你有所帮助。ID处理工具共包括ID Simplify、ID Rename和ID Prefix三部分。

进入TBtools界面,点击Sequence Toolkit进入Fasta Tools即可看到(如下图)。

演示文件

代码语言:javascript代码运行次数:0运行复制>ATCG00050.1 pacid=19637970 locus=ATCG00050 ID=ATCG00050.1.TAIR10 annot-version=TAIR10

ATGGTAAAACTTCGTTTAAAACGATGTGGTAGAAAGCAACGAGCCGTTTATCGAATCCTT

GCAATTGATGTTCGATACCGAAGAGAAGGAAGAGATCTTAGTAAGGTGGGTTTTTATGAT

CCCATAACTAATCAAACTTTTTTAAACCTTTCTGCTATTCTCGATTTTCTTAAAAAAGGA

GCTCAACCAACAAGAACAGCTCATGATATTTCAAAGAAGGCTGGGATTTTTACGGAATGA

>ATCG00065.1 pacid=19638004 locus=ATCG00065 ID=ATCG00065.1.TAIR10 annot-version=TAIR10

ATGCCAACCATTAAACAACTTATTAGAAATACAAGACAGCCAATCCGAAACGTCACGAAA

TCCCCAGCGCTTCGGGGATGCCCTCAGCGACGAGGAACATGTACTCGGGTGTAT

>ATCG00070.1 pacid=19637972 locus=ATCG00070 ID=ATCG00070.1.TAIR10 annot-version=TAIR10

ATGCTTAATATATTTAATTTGATCTGTATTTTTTTTAATTCTACCCTTTTTTCAAGCACT

TTTTTAGTCGCCAAATTGCCAGAGGCCTACGCCTTTTTGAATCCAATCGTAGATGTTATG

CCCGTAATACCTCTTTTCTTTCTTCTCTTAGCCTTTGTTTGGCAAGCCGCTGTAAGTTTT

CGATAA

>ATCG00080.1 pacid=19637976 locus=ATCG00080 ID=ATCG00080.1.TAIR10 annot-version=TAIR10

ATGCTTACTCTCAAACTTTTTGTATACACTGTAGTTATATTCTTTGTTTCTCTCTTCATA

TTTGGATTCCTATCTAATGATCCAGGACGTAATCCGGGACGTGAAGAATAA功能介绍

1.ID Simplify(ID简化)

ID简化可以将原始序列ID的描述信息去掉从而实现简化。

输出结果:

代码语言:javascript代码运行次数:0运行复制>ATCG00050.1

ATGGTAAAACTTCGTTTAAAACGATGTGGTAGAAAGCAACGAGCCGTTTATCGAATCCTT

GCAATTGATGTTCGATACCGAAGAGAAGGAAGAGATCTTAGTAAGGTGGGTTTTTATGAT

CCCATAACTAATCAAACTTTTTTAAACCTTTCTGCTATTCTCGATTTTCTTAAAAAAGGA

GCTCAACCAACAAGAACAGCTCATGATATTTCAAAGAAGGCTGGGATTTTTACGGAATGA

>ATCG00065.1

ATGCCAACCATTAAACAACTTATTAGAAATACAAGACAGCCAATCCGAAACGTCACGAAA

TCCCCAGCGCTTCGGGGATGCCCTCAGCGACGAGGAACATGTACTCGGGTGTAT

>ATCG00070.1

ATGCTTAATATATTTAATTTGATCTGTATTTTTTTTAATTCTACCCTTTTTTCAAGCACT

TTTTTAGTCGCCAAATTGCCAGAGGCCTACGCCTTTTTGAATCCAATCGTAGATGTTATG

CCCGTAATACCTCTTTTCTTTCTTCTCTTAGCCTTTGTTTGGCAAGCCGCTGTAAGTTTT

CGATAA

>ATCG00080.1

ATGCTTACTCTCAAACTTTTTGTATACACTGTAGTTATATTCTTTGTTTCTCTCTTCATA

TTTGGATTCCTATCTAATGATCCAGGACGTAATCCGGGACGTGAAGAATAA2.ID Rename(ID重命名)

我们对上一步简化后的ID进行重命名,具体步骤如下:

输出结果:

代码语言:javascript代码运行次数:0运行复制>New_id1

ATGGTAAAACTTCGTTTAAAACGATGTGGTAGAAAGCAACGAGCCGTTTATCGAATCCTT

GCAATTGATGTTCGATACCGAAGAGAAGGAAGAGATCTTAGTAAGGTGGGTTTTTATGAT

CCCATAACTAATCAAACTTTTTTAAACCTTTCTGCTATTCTCGATTTTCTTAAAAAAGGA

GCTCAACCAACAAGAACAGCTCATGATATTTCAAAGAAGGCTGGGATTTTTACGGAATGA

>New_id2

ATGCCAACCATTAAACAACTTATTAGAAATACAAGACAGCCAATCCGAAACGTCACGAAA

TCCCCAGCGCTTCGGGGATGCCCTCAGCGACGAGGAACATGTACTCGGGTGTAT

>New_id3

ATGCTTAATATATTTAATTTGATCTGTATTTTTTTTAATTCTACCCTTTTTTCAAGCACT

TTTTTAGTCGCCAAATTGCCAGAGGCCTACGCCTTTTTGAATCCAATCGTAGATGTTATG

CCCGTAATACCTCTTTTCTTTCTTCTCTTAGCCTTTGTTTGGCAAGCCGCTGTAAGTTTT

CGATAA

>New_id4

ATGCTTACTCTCAAACTTTTTGTATACACTGTAGTTATATTCTTTGTTTCTCTCTTCATA

TTTGGATTCCTATCTAATGATCCAGGACGTAATCCGGGACGTGAAGAATAA

3.ID Prefix(ID添加前缀)

ID prefix可以对序列ID添加需要的前缀信息,这里对上一步重命名后的ID增加前缀"Test-"。

输出结果:

代码语言:javascript代码运行次数:0运行复制>Test-New_id1

ATGGTAAAACTTCGTTTAAAACGATGTGGTAGAAAGCAACGAGCCGTTTATCGAATCCTT

GCAATTGATGTTCGATACCGAAGAGAAGGAAGAGATCTTAGTAAGGTGGGTTTTTATGAT

CCCATAACTAATCAAACTTTTTTAAACCTTTCTGCTATTCTCGATTTTCTTAAAAAAGGA

GCTCAACCAACAAGAACAGCTCATGATATTTCAAAGAAGGCTGGGATTTTTACGGAATGA

>Test-New_id2

ATGCCAACCATTAAACAACTTATTAGAAATACAAGACAGCCAATCCGAAACGTCACGAAA

TCCCCAGCGCTTCGGGGATGCCCTCAGCGACGAGGAACATGTACTCGGGTGTAT

>Test-New_id3

ATGCTTAATATATTTAATTTGATCTGTATTTTTTTTAATTCTACCCTTTTTTCAAGCACT

TTTTTAGTCGCCAAATTGCCAGAGGCCTACGCCTTTTTGAATCCAATCGTAGATGTTATG

CCCGTAATACCTCTTTTCTTTCTTCTCTTAGCCTTTGTTTGGCAAGCCGCTGTAAGTTTT

CGATAA

>Test-New_id4

ATGCTTACTCTCAAACTTTTTGTATACACTGTAGTTATATTCTTTGTTTCTCTCTTCATA

TTTGGATTCCTATCTAATGATCCAGGACGTAATCCGGGACGTGAAGAATAA

相关推荐

和应用试客那样的app有哪些?2024差不多的软件介绍
365bet是什么公司

和应用试客那样的app有哪些?2024差不多的软件介绍

⌛ 09-02 👁️ 9798
网友评论:世界杯欧洲篇之七种武器
365bet是什么公司

网友评论:世界杯欧洲篇之七种武器

⌛ 07-09 👁️ 8248
登场人物
365bet是什么公司

登场人物

⌛ 07-07 👁️ 9100