perl 讀取所需檔案的路徑，然後開啟相應的檔案

最後更新：2018-12-08 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

以下是DNA序列，儲存在window下F：\perl\data.txt裡面：

複製代碼代碼如下:AAAAAAAAAAAAAAGGGGGGGTTTTCCCCCCCC
CCCCCGTCGTAGTAAAGTATGCAGTAGCVG
CCCCCCCCCCGGGGGGGGAAAAAAAAAAAAAAATTTTTTAT
AAACG

下面是程式：

複製代碼代碼如下:#下面的程式是用來計算一段DNA序列中ATGC的數量的

#首先定義四種堿基的數量為0
$count_A=0;
$count_T=0;
$count_C=0;
$count_G=0;
#首先要先把序列進行合并成一行

#先確定所要處理的檔案的路徑及檔案名稱（在windows系統下面要按照這樣的例子寫
#f:\\perl\\data.txt
print "please input the Path just like this f:\\\\perl\\\\data.txt\n";
chomp($dna_filename=<STDIN>);
#開啟檔案
open(DNAFILENAME,$dna_filename)||die("can not open the file!");
#將檔案賦予一個數組
@DNA=<DNAFILENAME>;

#以下兩步要把所有的行合并成一行，然後去掉所有的空白符
$DNA=join('',@DNA);
$DNA=~s/\s//g;

#將DNA分解成，然後賦值到數組
@DNA=split('',$DNA);

#然後依次讀取數組的元素，並對四種堿基的數量進行統計
foreach $base(@DNA)
{
if ($base eq 'A')
{
$count_A=$count_A+1;
}
elsif ($base eq 'T')
{
$count_T=$count_T+1;
}
elsif ($base eq 'C')
{
$count_C=$count_C+1;
}
elsif ($base eq 'G')
{
$count_G=$count_G+1;
}
else
{
print "error\n"
}
}
#輸出最後的結果
print "A=$count_A\n";
print "T=$count_T\n";
print "C=$count_C\n";
print "G=$count_G\n";

下面是啟動並執行結果：複製代碼代碼如下:F:\>perl\a.pl
please input the Path just like this f:\\perl\\data.txt
f:\\perl\\data.txt
error
A=40
T=17
C=27
G=24

F:\>

大家可能觀察到有一個error的出現，這是為什麼呢？

大家仔細看一看最上面的原始 DNA序列，用特殊顏色標記的，可以看到有一個V，所以會輸出錯誤。

這裡把DNA序列經過整合成一行，然後去除所有的空白字元以後，又把$DNA通過split函數變成了數組，然後進行統計，那有沒有更好的辦法呢？

其實perl裡有一個函數，substr。

我們先來看一看這個函數的用法，substr是針對一個大字串的操作符（The substr function works with only a part of a larger string )言外之意就是對一個很長的字串，進行片段化處理，取其中的一部分。我們這裡用到的就是這個特性。

$little_string =substr($large_string,$start_position,$length)

$小片段=substr（$大片段，$你要截取的小片段的起始位置，$你要截取的長度）

我們這裡為了統計DNA中各種堿基的數量，所以要處理的字串是一個堿基，所以我們要把$length設定為1。這樣才能夠滿足我們的需求。

下面我們把修改過的代碼寫下：

複製代碼代碼如下:#下面的程式是用來計算一段DNA序列中ATGC的數量的

#首先定義四種堿基的數量為0
$count_A=0;
$count_T=0;
$count_C=0;
$count_G=0;
#首先要先把序列進行合并成一行

#以下兩步要把所有的行合并成一行，然後去掉所有的空白符
$DNA=join('',@DNA);
$DNA=~s/\s//g;

#然後依次讀取字串的元素，並對四種堿基的數量進行統計
for ($position=0;$position<length $DNA;++$position)
{
$base=substr($DNA,$position,1);
if ($base eq 'A')
{
$count_A=$count_A+1;
}
elsif ($base eq 'T')
{
$count_T=$count_T+1;
}
elsif ($base eq 'C')
{
$count_C=$count_C+1;
}
elsif ($base eq 'G')
{
$count_G=$count_G+1;
}
else
{
print "error\n"
}
}
#輸出最後的結果
print "A=$count_A\n";
print "T=$count_T\n";
print "C=$count_C\n";
print "G=$count_G\n";

得到的結果如下：

複製代碼代碼如下:F:\>perl\a.pl
please input the Path just like this f:\\perl\\data.txt
f:\\perl\\data.txt
error
A=40
T=17
C=27
G=24

F:\>

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

perl 讀取所需檔案的路徑，然後開啟相應的檔案

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support