
将序列转换为FASTA格式的方法.docx
3页将序列转换为 FASTA 格式的方法方法一:利用NCBI Entrez查询序列并转存成为fasta格式Entrez基本操作1. 进入 NCBI 主网页 (http://www.ncbi.nlm.nih.gov)2. 在网页上方Search栏选择database (例:protein),在for字段输入keyword (例: TF3A_*),然后按 GO3. 储存个别序列档案:结果网页出现后,例如勾选P03001,在Display栏选择FASTA,在Send to栏选择file, 按Send to按钮即可将P03001序列以FASTA格式存在自己的PC中记得选取适当的目 录,并输入正确的档名例: tf3a_xenla.txt)4.如何储存batch序列档案:结果网页出现后,勾选 P34694、P34695、P17842、Q92664、P03001、P39933 等六条序 列,在Display栏选择FASTA,在Send to栏选择file,按Display按钮可以检视这些序列 的FASTA格式内容,按Send to按钮则可将这一组序列以FASTA格式存在自己的PC 中记得选取适当的目录,并输入正确的档名。
例:tf3abatch.txt)这个batch序列档案可 以用 JEMBOSS 的 emma 程序进行多序列并列分析Lirniis rTGVTcmnncA nmui y CTipiJuarcr_ DMay jFA^£TA ▼呃kgw -1 如 工]gendto jFite ;Items 1-6 off 6S1: F0300L Iiansciiption fac^.[si:2851464]>gi 12851^641 sp!P03Q01 ITF3AJ(EHLA TransciipHon factor TIIA (Factor A) (TFIIIA) (S^II MAAKVMTSgEEAH^LUTMElOEKlLPVWKRVIC^ADCCSAAYNmKLjQAHLjCKirDGEKPFI^XEEGCEKOTTSLHHL™SLTHTOEKHFT?D SDGCDLRF TTKAWMmiFNR™ IKICTWC H?ENCGKAFKK HNQUGmQ 住 fJTLP 翌凹KEGCMRF ELPERLmE 曲MAGVTCJRKDD配旺 UG£Tm 此畑7朋 OH QDLAVCDVCMRKFRHKDYLRDHQKIBEKEinWLCPRBGCDRSYTrAFMLR 沖 IQEFHE 現RPFVCEHAG CGKCFAiraSl^RJiSVVHDPE^RKIJ^KCPRPKRSUSRLTGYEPPKS^EOJlSVSGTEKTOSLVKJrKPS GTEniGSLVLDKLTlQj 冋 2: Q92664. Tianscjiptianfac...[gi:2501697]>gi12501(5971 spIQ92M lTF3A_HUmi Transciiptian factor 1IIA (Factor A') (TTI11观 MRSS&/WAGRCIJVTARriPGOTASRE(iSAGSRGFGABFFARWARGSABjFGWGAGMJ)PPAWAESVS 乩TI AD 対H AaGE W^PTPPRPALPRRF I 饰 FPDS 脚能 KA痕D 皿;KJTTGERPFVCMEGCSKAFI方法二:利用 JEMBOSS 的 seqret 进行格式转换请参考JEMBOSS使用说明网页,seqret部分方法三:利用 GCG command mode 的 tofasta 程序将 gcg 格式的序列转为 fasta 格式使用方法unix % tofasta 序列档案再选择需要转换的区域 (例如:从第 a 个到第 b 个),最后储存已转换成功的档案说明假设使用者有一条 gcg 格式的蛋白质序列 tf3a_xenbo.swissprot (核酸序列亦可), 可以利用tofasta tf3a_xenbo.swissprot 来将序列转换为 fasta 格式。
存盘之后,再以 more 指令检查是否确实转换完成into Fast-k format.TuFastA converts GCG sequencE(3)Begin (End p選揮序列轉換格式的區域What should I call theoutput tile(方 tf3 a xentoo. tfa 方)TF3A ^ENEO339 characters.S39 symbols written into rrtf 3 a wenho . tf arr.gcg2 30% more tf 3a_xeiibo . t£a>TF3A_XENB0 ID TF3A_XENB0 STANDARD; PRT; 339 AA.MGE KAL PWYKRYICSFAD CGAS YNKNWKL RAHL C KHTGE KPFPCKEEGCD KGF TS L HHL TRHSITHTGEKNFKCDSDKCDLTFTTKANMKKHFNRFHNLQLCVYVCHFEGCDKAFKKHW QLKVHQFTHTLPYKCPHEGCDKSFSVPSCLKRHEKVHAGYPCKKDDSjCLFVGKTWTLY LKHVKECHQEPVMCDEC KRTFKHKDYLRNHKKTHKKERTVYCCPRDGCERSYTTEFNLQS HMQS FHEE QRP FACE HAEjCGKS F AMRKS L E RHSWHD P E KRKL KE KC P RP KRS L AS RL SG CAPPKS KE KS AAKATE KTGSWKNKP SGTE TKGS LVIEKToFastA 使用方法参考:http://bioinfo.nhri.org.tw/gcghelp/tofasta.htmlCopyright © National Health Research Institutes. All rights reserved.。












