วันจันทร์ที่ 18 กรกฎาคม พ.ศ. 2554

ไขปริศนา "กำเนิดรหัสแห่งชีวิต"

รหัสพันธุกรรมที่อยู่บนสาย DNA เขียนขึ้นด้วยเบส 4 ชนิด คือ adenine (A), guanine (G), thymine (T), และ cytosine (C) เรียงกันเป็นคำๆ (mRNA ตรง thymine จะแทนที่ด้วย uracil หรือ U) แต่ละคำจะเรียกว่า codon ประกอบด้วยความยาว 3 เบส แต่ละ codon แทนค่าเป็นหนึ่งในกรดอะมิโน 20 ตัวรวมทั้งรหัสหยุด (stop codon)* อีก 3 ตัว

ถ้ามาคำนวณกันเล่นๆ รูปแบบที่เป็นไปได้ทั้งหมดของการเรียงเบส 4 ขนิดติดกัน 3 ตัว คือ 64 รูปแบบ จะเห็นว่าเลข 64 มากกว่า 20 ตั้งสามเท่ากว่าๆ แหนะ ฉะนั้นคงพอเดากันได้แล้วสินะว่า กรดอะมิโนส่วนใหญ่จะถูกแทนค่าได้มากกว่า 1 codon ขึ้นไป** เช่น GCU, GCC, GCA, GCG แทน Alanine หรือ ACU, ACC, ACA, ACG แทน Threonine เป็นต้น

ในเมื่อเลขมันไม่ลงตัวพอดีกันเป๊ะๆ เช่นนี้ มีใครสงสัยกันบ้างหรือเปล่าว่า แล้วทำไมธรรมชาติจึงเลือกเลขชุดนี้ขึ้นมาสร้างเป็น "genetic code"? ทำไมต้องมีเบส 4 ชนิด? ทำไมต้องเรียงกัน 3 ตัว? ทำไมใช้แทนค่ากรดอะมิโน 20 ชนิด? ทำไมต้อง 3-4-20? (กลับบนล่าง, แทงเต็ง-แทงโต๊ดกันเองนะ แทงผิด ผมไม่เกี่ยว แต่ถ้าถูก แบ่งผมด้วย ^.^) มันจะน่าทึ่งเข้าไปอีกถ้าคุณได้ทราบว่าสิ่งมีชีวิตทั่วโลกใช้รูปแบบ 3-4-20 นี้ให้การเข้ารหัสและถอดรหัสเหมือนกันหมด (การแทนค่าของรหัสก็เหมือนกันแทบทั้งหมด ยกเว้นสิ่งมีชีวิตไม่กี่ชนิดที่แปลรหัสบางตัวต่างออกไป รายละเอียดอ่านเพิ่มเติมได้จากบทความ genetic code ใน Wikipedia)

ไม่ว่าคุณจะสงสัยหรือไม่ วิทยาศาสตร์ก็มีคำอธิบายแบบต่างๆ ไว้ให้คุณ แต่คำอธิบายเหล่านี้ก็ยังไม่ใช่สิ่งสัมบูรณ์ที่ทุกคนยอมรับ มันขึ้นอยู่กับว่าใครพอใจคำอธิบายแบบไหน มันก็เหมือนกับการขูดเลขขอหวยนั่นแหละ ใครพอใจเลขไหนก็แทงเลขนั้น (ย้ำอีกที ถ้าถูกงวดนี้ แบ่งผมด้วย)

คำอธิบายอย่างแรก คือ “ก็มันเป็นของมันแบบนี้”

ย้อนไปตั้งแต่สมัยที่เราเพิ่งรู้โครงสร้าง DNA ใหม่ๆ Franncis Crick หนึ่งในสองผู้ร่วมค้นพบโครงสร้าง DNA (อีกคนคือ James D. Watson) เคยให้ความเห็นไว้ว่าเลขชุดนี้ คือ "ความบังเอิญแช่แข็ง" (frozen accident) มันเหมือนกับประเพณีที่เผอิญว่าเซลล์เริ่มแรกเลือกทำแบบนี้แหละ และรุ่นต่อไปๆ ก็คงประเพณีไว้อย่างนั้นเหมือนถูกแช่แข็งในกาลเวลา จบข่าว...

คำอธิบายแรกจบแค่นี้จริงๆ กำปั้นทุบดินกันแบบนี้เลยแหละ

แต่นักวิทยาศาสตร์ส่วนใหญ่ไม่เชื่อว่ามันจะเป็นเรื่องบังเอิญแบบที่ Francis Crick คิด เพราะถ้าสังเกตจากรหัส codon ที่แทนกรดอะมิโนตัวเดียวกัน จะเห็นว่าส่วนใหญ่ต่างกันแค่เบสตัวที่ 3 ซึ่งหมายความว่าหากเกิดการกลายพันธุ์***ที่เบสตัวที่ 3 พอแปลรหัสออกมาก็ยังได้กรดอะมิโนตัวเดิม หรือต่อให้มีการกลายพันธุ์จนแปลผิดไปเลย ส่วนใหญ่โปรตีนที่ได้ก็ยังจะมีคุณสมบัติคล้ายกับโปรตีนก่อนเกิดการกลาย พันธุ์ เซลล์เริ่มแรกบังเอิญเลือกโดนเอารูปแบบที่โชคช่วยสวรรค์บันดาลขนาดนี้มาได้ อย่างไร? จากการคำนวณของทีมวิจัยที่นำโดย Peter Clote รูปแบบ genetic code ทั้งหมดที่เป็นไปได้ของการจับคู่ codon 64 แบบ กับกรดอะมิโน 20 ตัว คือ 1,084 รูปแบบ

มันจะบังเอิญว่าบรรพบุรุษของเราเลือกมา 1 จาก 1,084 รูปแบบ แล้วโป๊ะเชะ ใช้ได้เลย ง่ายๆ กันแบบนี้เลยหรือ? (อย่าลืมว่า genetic code เหมือนกันหมดแทบทั้งโลก ฉะนั้นถ้าเป็นการเลือกสุ่มยกชุด มันจะต้องเป็นการเลือกเพียงครั้งเดียวโดยเซลล์ต้นแบบอันเดียว)

ดังนั้นคนที่ไม่พอใจกับคำอธิบายแบบแรกก็คิดหาคำตอบอื่นๆ ต่อไป

คำอธิบายที่สอง “นี่คือสิ่งที่ดีที่สุด”

Tsvi Tlusty นักฟิสิกส์จาก Weizmann Institute of Science ในประเทศอิสราเอล คิดว่ารูปแบบ genetic code ที่เราเห็นกันทุกวันนี้จะต้องเป็นผลจากกระบวนการคัดเลือกตามธรรมชาติ (natural selection) เขาเสนอว่าสิ่งที่เป็นแรงกดดันของวิวัฒนาการ "ภาษาพันธุกรรม" มี 3 อย่างคือ
1. ถ้าหากมีการสะกดคำผิด เช่น "เย็น" เป็น "เย็บ" หรือ "เย็..." (เซ็นเซอร์) ความเสี่ยงที่จะได้ความหมาย (โปรตีน) ที่เป็นอันตรายต่อเซลล์ต้องต่ำ
2. คำในภาษา "พันธุกรรม" จะต้องมีความหมายหลากหลายครอบคลุมการทำงานต่างๆ ของเซลล์
3. ภาษานี้จะต้องไม่ใช้ทรัพยากรในการสะกดคำและแปลความหมายมากเกินจำเป็น กิจกรรมทุกอย่างในเซลล์มีต้นทุน ไม่มีอะไรในโลกได้มาฟรีๆ

เมื่อลองเอาไปเทียบกับปัญหาคลาสสิคของทางภูมิศาสตร์ที่ถามว่า "ต้องใช้สีอย่างน้อยที่สุดกี่สีจึงจะเขียนแผนที่โลกได้โดยไม่มีประเทศใดที่ อยู่ติดกันใช้สีซ้ำกันเลย?" ถ้าเป็นในแผนที่สองมิติ คำตอบคือ "4 สี" แต่ถ้าเป็นแผนที่มากกว่าสองมิติขึ้นไป คำตอบจะเพิ่มเป็น "20-25 สี" ซึ่งนั่นก็ตรงกับจำนวนกรดอะมิโน 20 ตัวที่ใน genetic code พอดี (กรดอะมิโนเป็นคำสามัญหมายถึงสารประกอบอินทรีย์ที่มีหมู่คาร์บอกซีลิกและ หมู่อะมิโนอยู่ในโมเลกุลเดียวกัน แต่กรดอะมิโนที่เป็นองค์ประกอบของโปรตีนมีเพียง 22 ชนิดเท่านั้น ในจำนวนนี้มี 20 ชนิดที่มีรหัสแปลใน genetic code อ่านเพิ่มเติมจากบทความ Proteinogenic amino acid ใน Wikipedia)

เมื่อ Tsvi Tlusty ลองสร้างแบบจำลองโดยใช้สมมติฐาน 3 ข้อที่เสนอไปข้างต้น ก็พบว่า ชุดเลข "เบส 4 ชนิด เรียงกัน 3 ตัว แทนกรดอะมิโน 20 ชนิด" หรืออะไรที่ใกล้เคียงกันประมาณนี้ เป็นรูปแบบที่เข้ากับแรงกดดันทั้งสามได้ดีที่สุด ไม่มากเกินไป ไม่น้อยเกินไป

อย่างไรก็ตาม Eugene Koonin นักชีววิทยาโมเลกุลแห่ง National Center for Biotechnology Information in Bethesda ไม่ค่อยเห็นด้วยกับข้อสรุปแบบนี้เท่าไร เขายอมรับว่า genetic code ที่ใช้กันอยู่นี้น่าจะเป็นรูปแบบที่ดีที่สุดแล้วเท่าที่สิ่งมีชีวิตจะสร้าง ได้ แต่มันจะเป็นผลจากการแข่งขันระหว่าง “สิ่งที่เหมาะสมมากกว่า” และ “สิ่งที่เหมาะสมน้อยกว่า” แบบในการคัดเลือกตามธรรมชาติจริงหรือ? เขาคิดว่าถ้าการคัดเลือกตามธรรมชาติเป็นไปตามรูปแบบนี้จริง ทำไมเราถึงไม่เห็นความแปรผันของรูปแบบนี้หลงเหลืออยู่เลย ทำไมไม่มีสิ่งมีชีวิตที่ใช้เบส 5 ชนิด เรียงกัน 2 ตัว แทนกรดอะมิโนสัก 18 ชนิด หรืออะไรสักอย่างที่ใกล้เคียงตัวเลข 3-4-20

และนั่นก็นำไปสู่คำอธิบายที่สาม

คำอธิบายที่สาม “นับหนึ่งถึงยี่สิบ”

ทีมวิจัยของ Eugene Koonin เชื่อว่าสิ่งมีชีวิตไม่น่าจะรับกรดอะมิโนเข้ามาอยู่ใน genetic code รอบเดียว 20 ตัวเลย เป็นไปได้ว่าตอนแรกอาจจะมีแค่ 16 ตัวหรือน้อยกว่า และแทนที่ด้วย codon ของเบส 4 ชนิดเรียงกันแค่ 2 ตัว (4 ยกกำลัง 2 เท่ากับ 16 พอดี) ต่อมาหน้าที่ของเซลล์ซับซ้อนขึ้น ฐานกรดอะมิโนสูงสุดแค่ 16 ตัวรองรับความหลากหลายของหน้าที่ไม่ไหว ก็เลยเพิ่มกรดอะมิโนเข้าไปใน genetic code อีก เลยต้องเพิ่มความยาว codon เป็น 3 ตัว พอเพิ่มเข้าไปแล้วมีตัวเลือกเหลือเฟือ ตัวไหนคล้ายๆ กันก็ใช้ซ้ำกันไปบ้าง ดีซะอีกจะได้เผื่อผิดเผื่อพลาดด้วย

ปัญหาต่อมาคือ "กรดอะมิโนตัวแรกที่เข้ามาอยู่ใน genetic code ได้แก่ตัวไหนบ้าง" นักวิทยาศาสตร์คิดว่ากรดอะมิโนที่เข้ามาเป็นตัวแรกๆ ต้อง 1) เกิดขึ้นมาก่อนกรดอะมิโนตัวอื่นๆ และ 2) เกาะกับ RNA ได้ดี เหตุที่ต้องเกาะกับ RNA ได้ดีเพราะว่ามันมีทฤษฎีหนึ่งบอกไว้ว่า RNA นี่แหละคือต้นกำเนิดของการควบคุมและการถ่ายทอดข้อมูลรหัสพันธุกรรม (เอาเข้าไป! นี่แหละงานของนักวิทยาศาสตร์ ตั้งทฤษฎีขึ้นมาซ้อนอีกทฤษฎี เหมือนกับ “ปั้นน้ำบนประสาททรายที่สร้างอยู่ในอากาศ” ยังไงยังงั้น)

ทีมวิจัยที่นำโดย Michael Yarus แห่งมหาวิทยาลัยโคโลราโด ได้ทดลองเอากรดอะมิโน 8 ชนิดเคลือบไว้บนผนังหลอดทดลอง แล้วล้างด้วยสารละลายที่มี RNA สายสั้นๆ เจือปนอยู่ ผลปรากฏว่ากรดอะมิโนแต่ละชนิดมีรูปร่างที่พอดีกับ "ช่องรับ" ที่แตกต่างกันไปบนสาย RNA แม้ว่าการจับคู่จะไม่ได้เหนียวแน่นอะไรนัก แต่ที่น่าสนใจคือ "ช่องรับ" ของ RNA ที่มีลำดับเบสตรงกับรหัส codon กรดอะมิโนชนิดใดใน genetic code ก็จะจับกับกรดอะมิโนชนิดนั้นได้ดีกว่า นี่เป็นหลักฐานที่สนับสนุนได้ว่าแรงทางเคมีมีผลในการคัดเลือกกรดอะมิโนเข้า สู่ genetic code เป็นไปได้ว่าอย่างต่ำสามในสี่ของกรดอะมิโน 20 ตัวจับพลัดจับผลูเข้าไปอยู่ใน genetic code ก็เพราะมันยึดกับ RNA ได้ดีนี่แหละ

จากการทดลองอันโด่งดังของ Stanley Miller ในปี 1953 ที่เขาผ่านกระแสไฟฟ้าเข้าไปในโถแก้วที่มีก๊าซไฮโดรเจน, ก๊าซมีเธน, แอมโมเนีย, และไอน้ำ แล้วเกิดกรดอะมิโนขึ้นจำนวนหนึ่ง กรดอะมิโนที่เกิดขึ้นแทบทุกครั้ง ได้แก่ glycine, alanine, aspartic acid, glutamic acid และ valine ซึ่งกรดอะมิโนทั้งห้านี้ก็พบในอุกกาบาตที่ตกกระทบทวีปออสเตรเลียในปี 1969 ด้วย ทำให้นักวิทยาศาสตร์เชื่อว่ากรดอะมิโนตัวแรกที่เข้าไปอยู่ใน genetic code ต้องอยู่ในห้าตัวนี้แหละ เพราะดูแล้วมันน่าจะมีโอกาสเกิดขึ้นเองตามธรรมชาติได้มากที่สุด (ข้อสังเกตคือกรดอะมิโนทั้งห้ามีรหัสใน genetic code ขึ้นต้นด้วย G หมดเลย)

นี่คือคำตอบสุดท้ายแล้วหรือ? เปล่าเลย กฏอย่างไม่เป็นทางการของวิทยาศาสตร์บอกไว้ว่า "คำตอบของคำถามจะนำไปสู่คำถามต่อไปเสมอ"

คำถามต่อไปในที่นี้คือ “แล้ว RNA มาจุ้นจ้านทำหน้าที่เลือกกรดอะมิโนได้อย่างไร?” ในกระบวนการของสิ่งมีชีวิต องค์ประกอบที่ทำหน้าที่แทบทุกอย่างในเซลล์คือโปรตีน แม้แต่การสร้าง DNA และ RNA ก็ต้องอาศัยโปรตีน นักวิทยาศาสตร์เชื่อว่าตอนแรกสิ่งมีชีวิตใช้โปรตีนทั้งการทำกิจกรรมต่างๆ ในเซลล์และการเก็บข้อมูลพันธุกรรม ต่อมาจึงใช้ RNA เก็บข้อมูลแทนที่โปรตีนและสุดท้ายจึงไปลงที่ DNA เพราะเสถียรกว่า ดังนั้นถ้า RNA เป็นตัวคัดเลือกว่าจะเอากรดอะมิโนอะไรไปสร้างโปรตีนแล้ว โปรตีนที่สิ่งมีชีวิตใช้สร้าง RNA ในตอนแรกมาจากไหน คำถามนี้ยิ่งกว่า “ไก่กับไข่อะไรเกิดก่อนกัน” เสียอีก

เพื่อจะหาว่าไก่ตัวไหนเป็นตัวแรกที่ออกลูกเป็นไข่ หรือไข่ใบไหนที่ฟักเป็นไก่ตัวแรก นักวิทยาศาสตร์ต้องมองหาโปรตีนและ RNA ที่เก่าแก่ที่สุด หรือจะเรียกว่าเป็น “คู่ของโปรตีนและ RNA ที่เป็นบรรพบุรุษของโปรตีนและสารพันธุกรรมทั้งมวลในสิ่งมีชีวิต” ก็ได้ ฟังดูเหมือนเป็นเรื่องยาก แต่ในความเป็นจริง นักวิทยาศาสตร์ไม่ต้องไปหาที่ไหนไกลเลย Loren Williams นักชีวเคมีจาก Georgia Institute of Technology ได้มองเข้าไปยัง “ไรโบโซม” (ribosome) ซึ่งออร์แกเนลล์ที่เซลล์ทุกเซลล์มี เพราะมันคือเครื่องจักรในการสร้างโปรตีนนั่นเอง

ในไรโบโซม โปรตีนจะจับกับ rRNA (RNA ในไรโบโซมเรียกว่า rRNA) เพื่อทำหน้าที่ในการสังเคราะห์โปรตีนจากกรดอะมิโนตามแบบแผนที่ร่างไว้ใน mRNA (ข้อมูลจาก mRNA ก็คัดลอกเอามาจาก DNA อีกต่อหนึ่ง) ถ้าทฤษฎีที่บอกว่า RNA เป็นตัวเลือกกรดอะมิโนเข้าสู่ genetic code เป็นจริง มันก็เป็นไปได้ว่าโปรตีนและ rRNA ที่อยู่ในไรโบโซมนี่แหละ คือ ทายาทที่สืบเชื้อสายตรงมาจากบรรพบุรุษคู่แรก หรือดีไม่ดี มันอาจเป็นร่างก็อปปี้ของ “คู่บรรพบุรุษ” ที่จำลองตัวเองผ่านกาลเวลามานับพันล้านปีเองเลยก็ได้

สิ่งที่ Loren Williams อ้างว่าเป็น RNA ที่เก่าแก่ที่สุดก็คือ rRNA ส่วนหนึ่งในไรโบโซมที่มีพันธะจับกับสาย rRNA ข้างเคียงหนาแน่นกว่า rRNA อื่นๆ อย่างเห็นได้ชัด อันนี้เทียบกับจากตรรกะที่ว่า “ถ้าคุณเข้าสังคมก่อน คุณก็ควรจะมีเพื่อนมากกว่าคนที่เข้าสังคมทีหลัง” (นึกถึงคนที่เล่น Facebook มาก่อนก็ควรจะมีเพื่อนมากกว่าคนที่เพิ่งเล่น กรณีนี้คงต้องยกเว้น Facebook ของคนดังหรือสาวน่ารักๆ – ซึ่งถ้าใครมีอย่างหลังส่งต่อมาให้ผมด้วย อย่ากั๊ก) และจากการศึกษาของทีมวิจัยที่นำโดย Loren Williams พบว่า โปรตีนที่จับ rRNA ส่วนดังกล่าวมีส่วน “หาง” เฉพาะที่ประกอบด้วย glycine กับ alanine

ดังนั้นจะสรุปได้เลยหรือไม่ว่า glycine และ alanine คือกรดอะมิโนตัวแรกที่ส่ิงมีชีวิตรับเข้ามาอยู่ใน genetic code?

คำตอบคือ ยังไม่ได้

ตอนนี้สิ่งที่นักวิทยาศาสตร์กำลังรอ คือ หลักฐานอีกทางที่จะมายืนยันการค้นพบนี้ อย่าลืมว่านี่เป็นการสืบสวนจากมุมมองของ “RNA ที่เก่าแก่ที่สุด” เท่านั้น ยังไม่ได้พูดถึง “โปรตีนที่เก่าแก่ที่สุด” เลย

Eric Gaucher นักชีววิทยาจาก Georgia Institute of Technology อีกเช่นกัน มีความคิดที่จะพิสูจน์จากทางโปรตีน เขาได้พยายามที่จะสร้างโปรตีนที่เก่าแก่ที่สุดขึ้นมาอีกครั้งโดยอาศัยข้อมูล จากโปรตีนที่พบในสิ่งมีชีวิตต่างๆ และกรดอะมิโนที่ค้นพบในอุกกาบาต เท่าที่ทราบล่าสุด ความพยายามของทีมวิจัยที่นำโดย Eric Gaucher ยังไม่ถึงขั้นที่จะประกาศความสำเร็จได้

Stephen Freeland แห่งมหาวิทยาลัยฮาวาย แสดงความเห็นว่าหากโปรตีนที่ Eric Gaucher สร้างได้เป็นโปรตีนที่เขียนได้ด้วยรหัส codon ที่ขึ้นต้นด้วย G และสามารถจับกับ RNA ได้ดี ก็อาจจะเป็นไปได้ว่ามันคือ “โปรตีนที่เก่าแก่ที่สุด” จริง หรืออย่างน้อยก็ใกล้เคียง และมันจะเป็นหลักฐานชิ้นเยี่ยมที่สนับสนุนว่าสิ่งที่นักวิทยาศาสตร์คิดมา ก่อนหน้านี้ถูกต้อง แต่ถ้าหากไม่เป็นตามนี้ ทุกอย่างต้องนับหนึ่งใหม่อีกรอบ...

...หรือไม่ก็แทงไปเลยว่า “มันเป็นของมันแบบนี้” แบบที่ Francis Crick บอก

จบข่าว (คราวนี้จบจริงๆ)

แปลและเรียบเรียงจากบทความ Alphabet of Life ในเว็บ ​Science News


*รหัสหยุด (stop codon) เป็นรหัสบนสาย mRNA ที่กำหนดว่าเมื่อกระบวนการ Translation (การแปลรหัสจาก mRNA เป็นโปรตีน) อ่านมาถึงจุดนี้ ก็ให้หยุดกระบวนการทันที

**ลักษณะที่กรดอะมิโนตัวหนึ่งแทนค่าด้วย codon ได้หลายรหัส เรียกว่า "degeneracy of genetic code"

***หลายคนอาจจะคิดว่า "การกลายพันธุ์" (mutation) ต้องมีการเปลี่ยนแปลงในระดับที่แสดงออกทางสรีรวิทยา ทางสัณฐานวิทยา หรือทางชีวเคมีอย่างใดอย่างหนึ่ง แต่ในทางชีววิทยาแล้วคำว่า "mutation" มีความหมายกว้างมาก โดยรวมๆ จะหมายถึงการเปลี่ยนแปลงลำดับเบสบน DNA (ถ้าเป็นไวรัสบางชนิดก็ RNA) แค่เบสเปลี่ยนไปหนึ่งตัวก็นับเป็น mutation แล้ว เรียกว่า "point mutation"

ที่มา http://jusci.net/node/1547