S

07 Bioinformatics

ชีวสารสนเทศศาสตร์ (Bioinformatics) เป็นศาสตร์ที่ประยุกต์ใช้เทคโนโลยีสารสนเทศกับข้อมูลทางชีวภาพ โดยพัฒนามาจากความก้าวหน้าทางวิทยาศาสตร์และเทคโนโลยีชีวภาพด้านจีโนม (จีโนมิกส์และโปรตีโอมิกส์) รวมถึงการพัฒนาของคอมพิวเตอร์และระบบฐานข้อมูลที่เกี่ยวข้องกับสิ่งมีชีวิตต่างๆ

ความสำคัญของชีวสารสนเทศศาสตร์:

  • ช่วยให้นักวิจัยสร้างมาตรฐานการเก็บข้อมูลพื้นฐานทางด้านโมเลกุล โปรตีโอม และจีโนมของสิ่งมีชีวิต

  • เป็นฐานในการสร้างแบบจำลองโครงสร้างสามมิติของโมเลกุลที่ซับซ้อน

  • ข้อมูลสามารถใช้ได้ทั่วโลก

  • ใช้ในการศึกษากลไกการเกิดโรคในระดับโมเลกุล

  • ทำให้ง่ายต่อการศึกษาเนื่องจากมีการจัดระบบค้นหาและเชื่อมโยงข้อมูล

  • ใช้จำลองโครงสร้างของโปรตีนที่เกิดจากกระบวนการผลิตลำดับดีเอ็นเอ

  • ทำให้ทราบขั้นตอนการสังเคราะห์แบบจำลองโปรตีน

ด้านต่างๆ ที่เกี่ยวข้องกับชีวสารสนเทศศาสตร์:

  • การวิเคราะห์ลำดับ (Sequence analysis): ศึกษาข้อมูลลำดับโมเลกุลทางชีวภาพ เพื่ออนุมานหน้าที่ ปฏิกิริยา วิวัฒนาการ และโครงสร้างโมเลกุล

  • การสร้างแบบจำลองโมเลกุล (Molecular modeling): ใช้การวิเคราะห์โครงสร้างและลำดับ เพื่อสร้างแบบจำลองโครงสร้างโมเลกุล

  • จีโนมิกส์ (Genomics): วิเคราะห์บริบทของยีนหรือจีโนมทั้งหมด

  • โปรตีโอมิกส์ (Proteomics): วิเคราะห์โปรตีนทั้งหมดของเซลล์หรือสิ่งมีชีวิต

ฐานข้อมูล (Databases) ในชีวสารสนเทศศาสตร์:

  • ฐานข้อมูลลำดับหลัก (Primary sequences): มีรหัสตัวอักษรสำหรับนิวคลีโอไทด์และกรดอะมิโน

  • ฐานข้อมูลลำดับ (Sequence databases): จัดเก็บข้อมูลลำดับจำนวนมากจากห้องปฏิบัติการทั่วโลก แต่ละฐานข้อมูลมีรูปแบบเฉพาะของตัวเอง

  • ฐานข้อมูลขนาดใหญ่: เช่น NCBI, GeneCards, PDB, ExPASy และ DDBJ

ระบบฐานข้อมูล (Database System): เป็นระบบที่รวบรวมข้อมูลต่างๆ ที่เกี่ยวข้องเข้าด้วยกันอย่างมีระบบ มีความสัมพันธ์ระหว่างข้อมูลที่ชัดเจน ประกอบด้วยแฟ้มข้อมูลหลายแฟ้มที่เชื่อมโยงกัน และมีซอฟต์แวร์ที่เรียกว่า ระบบจัดการฐานข้อมูล (DBMS) เป็นตัวกลางระหว่างผู้ใช้และโปรแกรมต่างๆ

ข้อมูลทางชีววิทยาโมเลกุลที่ใช้ในชีวสารสนเทศศาสตร์:

  • ลำดับดีเอ็นเอ (DNA sequence): มี 4 เบส A, T, C, G

  • ลำดับโปรตีน (Protein sequence): มี 20 ตัวอักษร

  • โครงสร้างโมเลกุลขนาดใหญ่ (Macro molecular structure): RNA, DNA, โปรตีน

  • จีโนมทั้งหมด (Whole genomes): ข้อมูลที่รวมลำดับดีเอ็นเอ ข้อมูลโปรตีน และฟังก์ชันโปรตีน

  • ข้อมูลไมโครอาร์เรย์ (Micro array data): ข้อมูลแสดงออกของยีน

  • ข้อมูลอื่นๆ: เช่น เมแทบอลิกพาทเวย์, เครือข่ายควบคุม, ความสัมพันธ์เชิงวิวัฒนาการ, ข้อมูลสิ่งแวดล้อม, และวรรณกรรมทางวิทยาศาสตร์

เครื่องมือและโปรแกรมที่ใช้ในการวิเคราะห์ข้อมูล:

  • BLAST & FASTA: เครื่องมือสำหรับการค้นหาความคล้ายคลึงของลำดับ

  • ClustalW: โปรแกรมสำหรับการจัดเรียงลำดับ

  • NEBcutter: โปรแกรมสำหรับทำแผนที่เอนไซม์ตัดจำเพาะ

  • ExPASY: แหล่งข้อมูลชีวสารสนเทศ

  • Primer3: โปรแกรมออกแบบไพรเมอร์

  • BioEdit: โปรแกรมสำหรับการจัดเรียงลำดับและแปลโปรตีน

  • Mega11: โปรแกรมสำหรับการวิเคราะห์เชิงวิวัฒนาการ

การวิเคราะห์เชิงวิวัฒนาการ (Phylogenetic analysis):

  • ใช้เพื่อเปรียบเทียบมากกว่า 2 ลำดับ และประมาณความสัมพันธ์เชิงวิวัฒนาการของสิ่งมีชีวิต

  • ใช้แผนผังต้นไม้เชิงวิวัฒนาการ (phylogenetic tree/dendrogram) ซึ่งมีโหนด กิ่ง และราก

  • มีทั้งต้นไม้แบบมีราก (rooted tree) และไม่มีราก (unrooted tree)

  • มีทั้งต้นไม้แบบมีสเกล (scaled tree) และไม่มีสเกล (unscaled tree)

ข้อควรระวังในการใช้ข้อมูล: ต้องสร้างลำดับข้อมูลที่เชื่อถือได้ ตรวจสอบความถูกต้องก่อนส่งฐานข้อมูล ใช้เครื่องมือวิเคราะห์ที่ถูกต้อง และตรวจสอบแหล่งที่มาของข้อมูลก่อนใช้งาน