ชีวสารสนเทศศาสตร์ (Bioinformatics) เป็นศาสตร์ที่ประยุกต์ใช้เทคโนโลยีสารสนเทศกับข้อมูลทางชีวภาพ โดยพัฒนามาจากความก้าวหน้าทางวิทยาศาสตร์และเทคโนโลยีชีวภาพด้านจีโนม (จีโนมิกส์และโปรตีโอมิกส์) รวมถึงการพัฒนาของคอมพิวเตอร์และระบบฐานข้อมูลที่เกี่ยวข้องกับสิ่งมีชีวิตต่างๆ
ความสำคัญของชีวสารสนเทศศาสตร์:
ช่วยให้นักวิจัยสร้างมาตรฐานการเก็บข้อมูลพื้นฐานทางด้านโมเลกุล โปรตีโอม และจีโนมของสิ่งมีชีวิต
เป็นฐานในการสร้างแบบจำลองโครงสร้างสามมิติของโมเลกุลที่ซับซ้อน
ข้อมูลสามารถใช้ได้ทั่วโลก
ใช้ในการศึกษากลไกการเกิดโรคในระดับโมเลกุล
ทำให้ง่ายต่อการศึกษาเนื่องจากมีการจัดระบบค้นหาและเชื่อมโยงข้อมูล
ใช้จำลองโครงสร้างของโปรตีนที่เกิดจากกระบวนการผลิตลำดับดีเอ็นเอ
ทำให้ทราบขั้นตอนการสังเคราะห์แบบจำลองโปรตีน
ด้านต่างๆ ที่เกี่ยวข้องกับชีวสารสนเทศศาสตร์:
การวิเคราะห์ลำดับ (Sequence analysis): ศึกษาข้อมูลลำดับโมเลกุลทางชีวภาพ เพื่ออนุมานหน้าที่ ปฏิกิริยา วิวัฒนาการ และโครงสร้างโมเลกุล
การสร้างแบบจำลองโมเลกุล (Molecular modeling): ใช้การวิเคราะห์โครงสร้างและลำดับ เพื่อสร้างแบบจำลองโครงสร้างโมเลกุล
จีโนมิกส์ (Genomics): วิเคราะห์บริบทของยีนหรือจีโนมทั้งหมด
โปรตีโอมิกส์ (Proteomics): วิเคราะห์โปรตีนทั้งหมดของเซลล์หรือสิ่งมีชีวิต
ฐานข้อมูล (Databases) ในชีวสารสนเทศศาสตร์:
ฐานข้อมูลลำดับหลัก (Primary sequences): มีรหัสตัวอักษรสำหรับนิวคลีโอไทด์และกรดอะมิโน
ฐานข้อมูลลำดับ (Sequence databases): จัดเก็บข้อมูลลำดับจำนวนมากจากห้องปฏิบัติการทั่วโลก แต่ละฐานข้อมูลมีรูปแบบเฉพาะของตัวเอง
ฐานข้อมูลขนาดใหญ่: เช่น NCBI, GeneCards, PDB, ExPASy และ DDBJ
ระบบฐานข้อมูล (Database System): เป็นระบบที่รวบรวมข้อมูลต่างๆ ที่เกี่ยวข้องเข้าด้วยกันอย่างมีระบบ มีความสัมพันธ์ระหว่างข้อมูลที่ชัดเจน ประกอบด้วยแฟ้มข้อมูลหลายแฟ้มที่เชื่อมโยงกัน และมีซอฟต์แวร์ที่เรียกว่า ระบบจัดการฐานข้อมูล (DBMS) เป็นตัวกลางระหว่างผู้ใช้และโปรแกรมต่างๆ
ข้อมูลทางชีววิทยาโมเลกุลที่ใช้ในชีวสารสนเทศศาสตร์:
ลำดับดีเอ็นเอ (DNA sequence): มี 4 เบส A, T, C, G
ลำดับโปรตีน (Protein sequence): มี 20 ตัวอักษร
โครงสร้างโมเลกุลขนาดใหญ่ (Macro molecular structure): RNA, DNA, โปรตีน
จีโนมทั้งหมด (Whole genomes): ข้อมูลที่รวมลำดับดีเอ็นเอ ข้อมูลโปรตีน และฟังก์ชันโปรตีน
ข้อมูลไมโครอาร์เรย์ (Micro array data): ข้อมูลแสดงออกของยีน
ข้อมูลอื่นๆ: เช่น เมแทบอลิกพาทเวย์, เครือข่ายควบคุม, ความสัมพันธ์เชิงวิวัฒนาการ, ข้อมูลสิ่งแวดล้อม, และวรรณกรรมทางวิทยาศาสตร์
เครื่องมือและโปรแกรมที่ใช้ในการวิเคราะห์ข้อมูล:
BLAST & FASTA: เครื่องมือสำหรับการค้นหาความคล้ายคลึงของลำดับ
ClustalW: โปรแกรมสำหรับการจัดเรียงลำดับ
NEBcutter: โปรแกรมสำหรับทำแผนที่เอนไซม์ตัดจำเพาะ
ExPASY: แหล่งข้อมูลชีวสารสนเทศ
Primer3: โปรแกรมออกแบบไพรเมอร์
BioEdit: โปรแกรมสำหรับการจัดเรียงลำดับและแปลโปรตีน
Mega11: โปรแกรมสำหรับการวิเคราะห์เชิงวิวัฒนาการ
การวิเคราะห์เชิงวิวัฒนาการ (Phylogenetic analysis):
ใช้เพื่อเปรียบเทียบมากกว่า 2 ลำดับ และประมาณความสัมพันธ์เชิงวิวัฒนาการของสิ่งมีชีวิต
ใช้แผนผังต้นไม้เชิงวิวัฒนาการ (phylogenetic tree/dendrogram) ซึ่งมีโหนด กิ่ง และราก
มีทั้งต้นไม้แบบมีราก (rooted tree) และไม่มีราก (unrooted tree)
มีทั้งต้นไม้แบบมีสเกล (scaled tree) และไม่มีสเกล (unscaled tree)
ข้อควรระวังในการใช้ข้อมูล: ต้องสร้างลำดับข้อมูลที่เชื่อถือได้ ตรวจสอบความถูกต้องก่อนส่งฐานข้อมูล ใช้เครื่องมือวิเคราะห์ที่ถูกต้อง และตรวจสอบแหล่งที่มาของข้อมูลก่อนใช้งาน