ChatGPT: ปฏิวัติวงการวิจัยด้วยพลังของ AI?

ณ วินาทีนี้ คงไม่มีใครในโลกเทคโนโลยี ไม่รู้จัก ChatGPT generative AI model อันเลื่องชื่อ ที่มีความสามารถในการสื่อสารกับมนุษย์อย่างเป็นธรรมชาติ ในบทความนี้ ทีม Nanoinformatics and Artificial Intelligence (NAI) Research Team จากกลุ่มวิจัย NCAS ของพวกเราจะขอมานำเสนอวิธีการใช้ ChatGPT ข้อจำกัดของมันในการนำมาใช้ช่วยเขียนและอ่านงานวิจัย จะเป็นอย่างไร ตามอ่านได้เลย

ก่อนที่เราจะพูดถึง ChatGPT จะขอเกริ่นเกี่ยวกับโมเดลทางภาษาขนาดใหญ่ (Large Language Models, LLMs) ที่สามารถสร้างรูปแบบสนทนาและข้อมูลได้คล้ายกับมนุษย์เสียก่อน โดยทั่วไป LLMs ทำงานผ่านการเรียนรู้เชิงลึก (deep learning) ซึ่งสร้างขึ้นด้วยโครงข่ายประสาทเทียมจำนวนหลายล้านพารามิเตอร์ที่ได้รับการฝึกสอนด้วยฐานข้อมูลขนาดใหญ่ [1] LLMs ที่เป็นที่นิยมและรู้จักใช้กันอย่างแพร่หลาย ได้แก่ BERT ของ google, AlexaTM (Teacher Models) ของ Amazon และแน่นอน GPT หรือ Generative Pretrained Transformer ของ OpenAI ซึ่งเป็นองค์กรวิจัยที่ก่อตั้งเมื่อปี 2015 มีวัตถุประสงค์มุ่งเน้นงานวิจัย พัฒนา และส่งเสริมปัญญาประดิษฐ์ เพื่อให้เป็นสมบัติของมนุษยชาติ ให้ทุกคนสามารถเข้าถึงและสามารถใช้งานได้
GPT จัดเป็นโมเดลภาษาขนาดใหญ่ถูกฝึกฝนกับข้อมูลจำนวนมหาศาลจากหนังสือ บทความ ข้อมูลบนอินเตอร์เน็ตจากทั่วโลก จึงมีความสามารถในการสื่อสารกับมนุษย์อย่างเป็นธรรมชาติ

ก่อนจะมาเป็น GPT เวอร์ชั่นปัจจุบัน OpenAI ได้พัฒนา GPT-1 ขึ้นในปี 2018 ซึ่งเป็นโมเดลต้นแบบขนาดเล็กที่ถูกฝึกสอนด้วยฐานข้อมูลหนังสือ “BookCorpus” (ฐานข้อมูลหนังสือฟรี ประมาณหมื่นกว่าเล่ม ประกอบด้วย 74 ล้านประโยค หรือ 1 พันล้านคำ)

ถัดมาในปี 2019 GPT-2 ถูกพัฒนาต่อยอดจาก GPT-1 โดยมีขนาดโมเดลที่ใหญ่ขึ้นและมีประสิทธิภาพที่ดีขึ้น ถูกฝึกสอนด้วยข้อมูลที่เพิ่มขึ้นจำนวนมากจากเว็บไซต์ GPT-2 นี้เริ่มได้รับความสนใจเนื่องจากความสามารถในการสร้างข้อความที่มีคุณภาพและความน่าเชื่อถือ

จากนั้นในปี 2020 ทีม OpenAI ได้เปิดตัว GPT-3 ซึ่งพัฒนาต่อจาก GPT-2 จุดเด่นของ GPT-3 คือความสามารถในการทำงานที่มีความเชื่อถือได้สูง และสามารถสร้างข้อความที่สมเหตุสมผลและถูกต้องมากยิ่งขึ้น เนื่องจากโมเดลที่ใหญ่ขึ้น มีพารามิเตอร์มากถึง 175 พันล้านตัว และถูกฝึกสอนด้วยข้อมูลที่เพิ่มขึ้นมากกว่าสองรุ่นก่อนหน้า [1] ซึ่งโมเดล GPT-3 และ GPT-3.5 เป็นรุ่นที่เปิดให้บุคคลทั่วไปได้ทดลองใช้งาน ด้วยรูปแบบฟังก์ชั่นหลักๆ คือการเขียนข้อความ หรือตอบคําถามจากผู้ใช้งาน โดยตัวระบบเรียนรู้ที่จะตอบได้อย่างเป็นธรรมชาติมาก และใกล้เคียงกับมนุษย์

ล่าสุดเมื่อวันที่ 14 มีนาคม 2023 ทีมวิจัย OpenAI ได้เปิดตัว GPT-4 ซึ่งเป็นรุ่นอัพเกรดล่าสุด ซึ่งยังไม่ได้เปิดให้บุคคลทั่วไปเข้าใช้งาน ข้อแตกต่างระหว่างรุ่น 4 และ 3 คือ มีความแม่นยำและถูกต้องมากยิ่งขึ้น มีความสามารถในการบรรยายภาพ มีความเชี่ยวชาญเฉพาะทางมากยิ่งขึ้น เป็นต้น อย่างไรก็ตาม ผู้คิดค้นและพัฒนา ChatGPT ก็ยอมรับว่าโมเดลมีข้อจำกัดและยังไม่สามารถเชื่อถือได้อย่างสมบูรณ์
.
ตัวอย่างการใช้งาน ChatGPT ในงานวิจัย
*การใช้ ChatGPT กับงานเขียนบทความทางวิชาการ (ผ่าน https://chat.openai.com/)*
ChatGPT สามารถใช้เป็นเครื่องมือในการทำวิจัย ค้นคว้าหาข้อมูล ตลอดจนใช้ในการช่วยเขียนบทความทางวิชาการได้อยู่บ้าง แต่ต้องใช้ด้วยความระมัดระวัง เพื่อให้อยู่ภายใต้นโยบายของสำนักพิมพ์

จากข้อมูลอัพเดทล่าสุดในปี 2023 สำนักพิมพ์ชื่อดังอย่าง Nature, Springer-Nature, Elsevier และ Taylor and Francis ได้มีการปรับนโยบายการเป็นผู้เขียน (authorship) ระบุไม่ให้ ChatGPT มีชื่อเป็นผู้เขียนหลักหรือผู้เขียนร่วมในบทความทางวิชาการ [2-4] หากนักวิจัยใดใช้เครื่องมือเหล่านี้จะต้องระบุการใช้งานในส่วนที่เหมาะสม เช่น “methodology” หรือ “acknowledgment” อย่างไรก็ดี ถึงแม้ว่าเราไม่สามารถให้ ChatGPT เป็นผู้เขียนได้ แต่เราสามารถใช้เป็นเครื่องมือในการช่วยเกลาบทความได้ หากแต่เราต้องตรวจเช็คความถูกต้องของเนื้อหาอย่างรอบคอบด้วย นอกจากนั้น ด้วยการที่มันเรียนรู้จากฐานข้อมูลจำนวน ChatGPT อาจมีการคัดลอกข้อความบางส่วนมาจากแหล่งที่มาต่างๆ ซึ่งจะนำไปสู่ plagiarism ได้ จึงจำเป็นต้องมีการเช็คในส่วนนี้ด้วย

ต่อไปจะขอยกตัวอย่างบทความ ชื่อเรื่องว่า “Is ChatGPT a Reliable Source for Writing Review Articles in Catalysis Research? A Case Study on CO2 Hydrogenation to Higher Alcohols” [5] ผู้เขียนลองให้ ChatGPT ช่วยวางโครงเรื่องของรีวิวเปเปอร์ในหัวข้อที่กำหนด แล้วก็ใช้ ChatGPT เติมข้อมูลทั้งหมดตาม outline ที่มันเสนอมา จากนั้นผู้เขียนก็นำข้อมูลที่ได้มาเปรียบเทียบกับเปเปอร์ที่ผ่าน peer review ในหัวข้อเดียวกัน ก็พบว่าข้อมูลที่ ChatGPT นำเสนอมานั้น มีโครงสร้างที่คล้ายกับรีวิวเปเปอร์ทั่วไป แต่ยังขาดข้อมูลเชิงลึกที่สำคัญ เช่น กลไกการเกิดปฏิกิริยา

นอกจากนี้ ChatGPT ที่เป็น text-based AI model ยังไม่สามารถใช้ช่วยเขียนตารางหรือเขียนกราฟสำหรับข้อมูลจากผลงานวิจัยเฉพาะทาง และที่แย่ไปกว่านั้นคือ ChatGPT ยังไม่สามารถอ้างอิงที่มาของเนื้อหา (ก็คือยังไม่สามารถ cite ไปยังบทความอื่นได้) ทำให้ยากต่อการเช็คว่าเนื้อหานั้นมีความถูกต้องขนาดไหน เพราะไม่ทราบแหล่งที่มา และเนื้อหาข้อความที่ ChatGPT เขียนขึ้นนั้นในหลายส่วนยังไม่ถูกต้องนักและมีความคลาดเคลื่อนในเชิงเทคนิคอยู่มาก
ยกตัวอย่างเช่น ChatGPT เขียนเกี่ยวกับกลไกการเกิดปฏิกิริยา CO2 Hydrogenation (การเติมไฮโดรเจนให้กับ CO2) เป็นแอลกอฮอล์ว่า CO2 + 2H2 → CH3OH ซึ่งเป็นเพียงกรณีหนึ่งที่เกิดขึ้นได้ของปฏิริยา CO2 Hydrogenation แต่เมื่อถามนักเคมีที่มีความรู้และความเชี่ยวชาญจะเขียนสมการรูปทั่วไปของปฏิกิริยานี้ได้เป็น nCO2 + 3nH2 → CnH2n+1OH +(2n-1)H2O จะเห็นได้ว่านักเคมีสามารถให้คำตอบที่ครบถ้วนมากกว่า โดยเฉพาะสำหรับงานที่ต้องการความเชี่ยวชาญเฉพาะทาง ChatGPT ยังต้องอาศัยการพัฒนาและเรียนรู้อีกมาก
.
*การใช้ ChatPDF – ChatGPT to PDF ให้อ่านบทความทางวิชาการ พร้อมตอบคำถามและสรุปประเด็นสำคัญ (ผ่าน https://www.chatpdf.com/)*
ตัวอย่างถัดไป เราจะมาลองใช้ ChatPDF ซึ่งเป็นแชทบอทของ ChatGPT ที่รับข้อมูลจากไฟล์เอกสาร PDF ซึ่งผู้ใช้ต้องการให้สรุป ถามคำถามเกี่ยวกับเนื้อหา หรือช่วยอธิบายเอกสารรายงานและงานวิจัยที่ซับซ้อนได้ เป็นต้น ตัวอย่างไฟล์เอกสารที่เราเลือกมาเป็น บทความตีพิมพ์จากกลุ่มวิจัย NCAS ชื่อเรื่องว่า “Energy efficiency of bio-coal derived from hydrothermal carbonized biomass: Assessment as sustainable solid fuel for municipal biopower plant” [6] ซึ่งบทความนี้ได้เขียนลงในเพจของกลุ่มวิจัย เมื่อวันที่ 2 พฤษภาคม 2023 สามารถตามอ่านเวอร์ชั่นที่สมาชิกของเราเขียนไว้ได้ในโพสต์ก่อน ทีนี้เรามาลองให้ ChatPDF สรุปเนื้อหาจากเปเปอร์

Q: สรุปเกี่ยวกับเปเปอร์นี้
ChatPDF : “งานวิจัยนี้เน้นการใช้กระบวนการ Hydrothermal Carbonization (HTC) เพื่อผลิตไบโอคอลจากไบโอมาสจากเปลือกปาล์มและต้นไผ่ โดยมีวัตถุประสงค์เพื่อเพิ่มประสิทธิภาพในการผลิตไบโอคอลและการใช้งานเป็นเชื้อเพลิงที่มีคุณภาพสูงในโรงไฟฟ้าไบโอมาส โดยได้ศึกษาผลกระทบของอัตราส่วนไบโอมาสต่อน้ำ อุณหภูมิและเวลาปฏิกิริยา รวมถึงการเพิ่มสารเติมเพื่อเพิ่มประสิทธิภาพในการผลิต ไบโอคอลที่ได้จากกระบวนการ HTC นี้มีคุณสมบัติที่คล้ายถ่านหินและมีความเป็นมิตรต่อสิ่งแวดล้อมมากกว่าเชื้อเพลิงจากแหล่งธรรมชาติ งานวิจัยนี้ยังพูดถึงการใช้ไบโอคอลเป็นแหล่งพลังงานทดแทนเชื้อเพลิงจากแหล่งธรรมชาติ การลดขนาดการเก็บเชื้อเพลิง ต้นทุนขนส่ง และการปลดปล่อยก๊าซ CO2 ในโรงไฟฟ้าไบโอมาส โดยไบโอคอลที่ได้จากกระบวนการ HTC นี้สามารถนำมาใช้เป็นแหล่งพลังงานทดแทนเชื้อเพลิงจากแหล่งธรรมชาติได้ โดยไม่ส่งผลกระทบต่อสิ่งแวดล้อมเช่นเดียวกับการใช้เชื้อเพลิงจากแหล่งธรรมชาติที่มีการใช้งานอย่างไม่มีวิจารณญาณ และส่งผลกระทบต่อสิ่งแวดล้อมอย่างมากในปัจจุบัน งานวิจัยนี้ได้รับการสนับสนุนจากทุนการศึกษาและทุนวิจัยต่างๆ อย่างมากมาย”

ในตัวอย่างข้างต้นเราอัพโหลดไฟล์ PDF ซึ่งเป็นภาษาอังกฤษ แต่ถามคำถามให้ ChatPDF สรุปเปเปอร์เป็นภาษาไทย จะเห็นว่า ChatPDF สามารถสรุปได้ประมาณนึง แต่อาจจะไม่แม่นยำถูกต้องมากนักในเชิงเทคนิค และถ้าเปรียบเทียบกับการถามตอบเป็นภาษาอังกฤษ เราพบว่าภาษาไทยจะใช้เวลามากกว่าภาษาอังกฤษ และภาษาที่เขียนในหลายส่วนอาจจะไม่ได้อ่านแล้วลื่นไหล อ่านแล้วยังสะดุดเพราะแปลตรงเกินไป ซึ่งอาจจะเกิดจากที่การเรียนรู้ของโมเดลด้วยภาษาไทยยังต้องการการพัฒนาต่อไปให้ดียิ่งขึ้น

นอกจากความสามารถข้างต้นแล้ว โมเดลตระกูล ChatGPT ยังสามารถช่วยร่างจดหมาย ช่วยเขียนอีเมล์สมัครงาน ช่วยเขียนโค้ดในการเขียนโปรแกรมคอมพิวเตอร์ เขียนบทละคร อธิบายเกี่ยวกับสมการทางคณิตศาสตร์ และอื่นๆ อีกมากมายที่ยังมีคนทดลองใช้งานกันต่อไป อย่างไรก็ตามความรู้ของ ChatGPT สร้างมาจากฐานข้อมูลจนถึงปี 2021 นั่นหมายความว่าคำถามหรือการค้นหาบางอย่างในปัจจุบัน ChatGPT (เวอร์ชั่นที่บุคคลทั่วไปทดลองใช้งาน) ยังไม่สามารถตอบได้ และถึงแม้ตอบได้ก็อาจจะไม่ได้ถูกต้องนัก ทั้งหมดเหล่านี้ยังต้องการการพิสูจน์และพัฒนาต่อไป ไม่แน่ว่าวันนึงอาจใช้ทำงานแทนมนุษย์เลยก็เป็นได้
เรียบเรียงโดย Nanoinformatics and Artificial Intelligence Research Team, NCAS
https://www.nanotec.or.th/…/artificial-intelligence/

ดร. มนฤดี เลี้ยงรักษา, ดร. อิทธิ ฉัตรนันทเวช, ดร. กนกกร พิมพ์เจริญ, ดร. สุรัฐ ธีรพิทยานนท์
ภาพประกอบสร้างโดย ใช้ chatGPT เขียน prompt สรุปเนื้อหาจากบทความ และป้อนเข้า stable diffusion (https://clipdrop.co/stable-diffusion)
#NCASresearch #ChatGPT #AI
เอกสารอ้างอิง
1. [https://en.wikipedia.org/wiki/Large_language_model]
2. Else, H., Abstracts written by ChatGPT fool scientists. Nature, 2023. 613(7944): p. 423.
3. Stokel-Walker, C., ChatGPT listed as author on research papers: many scientists disapprove. Nature, 2023. 613(7945): p. 620-621.
4. Dwivedi, Y.K., et al., Opinion Paper: “So what if ChatGPT wrote it?” Multidisciplinary perspectives on opportunities, challenges and implications of generative conversational AI for research, practice and policy. International Journal of Information Management, 2023. 71: p. 102642.
5. Zhong, Q., et al., Is ChatGPT a Reliable Source for Writing Review Articles in Catalysis Research? A Case Study on CO2 Hydrogenation to Higher Alcohols. 2023, Preprints.org.
6. Sattasathuchana, S., et al., Energy efficiency of bio-coal derived from hydrothermal carbonized biomass: Assessment as sustainable solid fuel for municipal biopower plant. Applied Thermal Engineering, 2023. 221: p. 119789.
https://m.facebook.com/story.php?story_fbid=pfbid0ogW1CbcJJtJvsnbSoRqXS4sbaUaQnzxuavxEBuXTFGQv57CJDdd4HJxU66X5odtMl&id=100076463822982&mibextid=qC1gEa

โพสต์ที่คุณน่าจะสนใจ

CCUS เทคโนโลยีกำจัดคาร์บอน สู่ทางรอดของประเทศไทย?

สวัสดีปีใหม่ 2567 ผู้อ่านทุกท่าน ปีเก่าผ่านไปปีใหม่เข้ามาพร้อมกับความท้าทายโจทย์ใหญ่โจทย์เดิม คือ สภาวะโลกร้อน ที่ทำให้เกิดสภาพอากาศแปรปรวน อันส่งผลกระทบต่อชีวิตมนุษย์และระบบนิเวศของโลก สภาวะโลกร้อนนี้มีสาเหตุหลักมาจากกิจกรรมของมนุษย์ที่เพิ่มปริมาณก๊าซเรือนกระจกในบรรยากาศ โดยก๊าซเรือนกระจกหลักก็คือคาร์บอนไดออกไซด์

CARBANO เทคโนโลยีผลิตถ่านกัมมันต์ประสิทธิภาพสูงจากวัสดุคาร์บอน

ประเทศไทยขึ้นชื่อว่าเป็นประเทศแห่งอุตสาหกรรมเกษตรและมีวัสดุเหลือทิ้งทางการเกษตรที่มากมายหลายหลาก การนำวัสดุเหลือทิ้งทางการเกษตรมาแปรรูปเป็นผลิตภัณฑ์มูลค่าสูงจึงเป็นหนึ่งในแนวคิดสำคัญที่จะช่วยเพิ่มรายได้ให้กับอุตสาหกรรมเกษตรของประเทศไทย หนึ่งในผลิตภัณฑ์มูลค่าสูงที่สามารถผลิตได้จากวัสดุเหลือทิ้งทางการเกษตร คือ ถ่านกัมมันต์ (activated carbon) ซึ่งเป็นถ่านที่มีรูพรุนปริมาณมาก สามารถนำไปใช้ดูดซับและกำจัดสิ่งปนเปื้อนเพื่อให้ได้ผลิตภัณฑ์ที่สะอาดเหมาะกับการนำไปใช้อุปโภคและบริโภคในอุตสาหกรรมต่างๆ เช่น

รางวัลโนเบล สาขาเคมี 2023 ผู้ปลูกควอนตัมดอทส์ เมล็ดพันธุ์แห่งวงการนาโนเทคโนโลยี

รางวัลโนเบลสาขาเคมีประจำปี 2023 ได้มอบรางวัลให้กับการค้นพบและการพัฒนาควอนตัมดอทส์(Quantum Dots, QTDs) หรือ “จุดควอนตัม” ซึ่งเป็นอนุภาคที่มีขนาดเล็กมากในระดับ 1-10 นาโนเมตร

รู้จักกับ “ลิกนิน” สารธรรมชาติที่แสนจะไม่ธรรมดา

ลิกนิน (Lignin) เป็นพอลิเมอร์ธรรมชาติ ที่สามารถพบได้ในพืชทั่วไปสูงถึง 30% ทำหน้าที่เปรียบเสมือนกาวประสานช่วยยึดโครงสร้างพืชให้มีความแข็งแรง นอกจากนี้ยังช่วยลดการระเหยของน้ำ และช่วยป้องกันการถูกทำลายของเนื้อเยื่อจากจุลินทรีย์ได้อีกด้วย ลิกนินมีโครงสร้างแบบอะโรมาติก (Aromatic

หมวดหมู่

โพสต์ยอดนิยม

Biorefinery series: น้ำมันเชื้อเพลิงอากาศยานชีวภาพจากน้ำมันปาล์ม

น้ำมันปาล์มเป็นน้ำมันพืชที่ได้จากผลของต้นปาล์มน้ำมันซึ่งเป็นพืชเศรษฐกิจที่หมุนเวียนได้ น้ำมันปาล์มนั้นสามารถนำมาใช้ประโยชน์ได้อย่างหลากหลาย ตั้งแต่นำมาใช้ได้โดยตรงเพื่อการปรุงอาหาร นำมาผลิตเป็นผลิตภัณฑ์เครื่องสำอาง หรือนำมาใช้เป็นสารตั้งต้นในอุตสาหกรรมโอลีโอเคมี (oleochemical industry) เช่น ผลิตสารหล่อลื่นชีวภาพ (biolubricant)

Biorefinery series: การสังเคราะห์สารเคมีมากมูลค่าจาก HMF (ตอนที่ 2)

จากบทความก่อนหน้านี้ เราได้บอกเล่าความน่าสนใจของสาร 5-ไฮดรอกซีเมทิลเฟอร์ฟูรัล (5-Hydroxymehylfurfural, HMF) และเล่าถึงวิธีการสังเคราะห์ชนิดนี้ไปแล้ว มาบทความในตอนที่ 3 ของ Biorefinery

โพสต์ล่าสุด

นาโนสารสนเทศและปัญญาประดิษฐ์ ใน ยุค Web 3.0

เราคงคุ้นเคยกับคำว่า ปัญญาประดิษฐ์ หรือ AI เป็นอย่างดี ว่าจะมาช่วยมนุษย์ทำงาน คิดวิเคราะห์ข้อมูล และช่วยในการตัดสินใจ ทำให้เราทำงานได้รวดเร็วและมีประสิทธิภาพยิ่งขึ้น เนื่องจาก

การคำนวณเคมีเชิงคอมพิวเตอร์ภายใต้กลุ่มวิจัย NCAS (ตอนที่ 1)

การพัฒนาตัวเร่งปฏิกิริยาเคมีใหม่ๆ เพื่อช่วยเพิ่มประสิทธิภาพของกระบวนการเคมี โดยหลักการนั้นไม่ต่างจากการออกแบบรถยนต์ ที่ต้องอาศัยความรู้ความเข้าใจเชิงลึกเกี่ยวกับการทำงานของเครื่องยนต์ แต่ในกรณีของตัวเร่งปฏิกิริยาเคมี เครื่องยนต์กลไกที่เป็นหัวใจของการเกิดปฏิกิริยานั้น เป็นผลมาจากแรงอันตรกิริยาที่เป็นแรงดูดหรือแรงผลักระหว่างพื้นผิวของตัวเร่งและโมเลกุลของสาร ซึ่งปรากฎการณ์ดังกล่าวนั้นเกิดขึ้นในระดับนาโนเมตรหรือเล็กกว่า การวิเคราะห์วัสดุที่มาตราส่วนดังกล่าวนั้นมีความซับซ้อนและมักมีข้อกำจัดด้านเครื่องมือ หรือในบางกรณีสมบัติที่สำคัญนั้นยังไม่สามารถวัดได้โดยเครื่องมือที่มีอยู่ในปัจจุบัน