ณ วินาทีนี้ คงไม่มีใครในโลกเทคโนโลยี ไม่รู้จัก ChatGPT generative AI model อันเลื่องชื่อ ที่มีความสามารถในการสื่อสารกับมนุษย์อย่างเป็นธรรมชาติ ในบทความนี้ ทีม Nanoinformatics and Artificial Intelligence (NAI) Research Team จากกลุ่มวิจัย NCAS ของพวกเราจะขอมานำเสนอวิธีการใช้ ChatGPT ข้อจำกัดของมันในการนำมาใช้ช่วยเขียนและอ่านงานวิจัย จะเป็นอย่างไร ตามอ่านได้เลย
ก่อนที่เราจะพูดถึง ChatGPT จะขอเกริ่นเกี่ยวกับโมเดลทางภาษาขนาดใหญ่ (Large Language Models, LLMs) ที่สามารถสร้างรูปแบบสนทนาและข้อมูลได้คล้ายกับมนุษย์เสียก่อน โดยทั่วไป LLMs ทำงานผ่านการเรียนรู้เชิงลึก (deep learning) ซึ่งสร้างขึ้นด้วยโครงข่ายประสาทเทียมจำนวนหลายล้านพารามิเตอร์ที่ได้รับการฝึกสอนด้วยฐานข้อมูลขนาดใหญ่ [1] LLMs ที่เป็นที่นิยมและรู้จักใช้กันอย่างแพร่หลาย ได้แก่ BERT ของ google, AlexaTM (Teacher Models) ของ Amazon และแน่นอน GPT หรือ Generative Pretrained Transformer ของ OpenAI ซึ่งเป็นองค์กรวิจัยที่ก่อตั้งเมื่อปี 2015 มีวัตถุประสงค์มุ่งเน้นงานวิจัย พัฒนา และส่งเสริมปัญญาประดิษฐ์ เพื่อให้เป็นสมบัติของมนุษยชาติ ให้ทุกคนสามารถเข้าถึงและสามารถใช้งานได้
GPT จัดเป็นโมเดลภาษาขนาดใหญ่ถูกฝึกฝนกับข้อมูลจำนวนมหาศาลจากหนังสือ บทความ ข้อมูลบนอินเตอร์เน็ตจากทั่วโลก จึงมีความสามารถในการสื่อสารกับมนุษย์อย่างเป็นธรรมชาติ
ก่อนจะมาเป็น GPT เวอร์ชั่นปัจจุบัน OpenAI ได้พัฒนา GPT-1 ขึ้นในปี 2018 ซึ่งเป็นโมเดลต้นแบบขนาดเล็กที่ถูกฝึกสอนด้วยฐานข้อมูลหนังสือ “BookCorpus” (ฐานข้อมูลหนังสือฟรี ประมาณหมื่นกว่าเล่ม ประกอบด้วย 74 ล้านประโยค หรือ 1 พันล้านคำ)
ถัดมาในปี 2019 GPT-2 ถูกพัฒนาต่อยอดจาก GPT-1 โดยมีขนาดโมเดลที่ใหญ่ขึ้นและมีประสิทธิภาพที่ดีขึ้น ถูกฝึกสอนด้วยข้อมูลที่เพิ่มขึ้นจำนวนมากจากเว็บไซต์ GPT-2 นี้เริ่มได้รับความสนใจเนื่องจากความสามารถในการสร้างข้อความที่มีคุณภาพและความน่าเชื่อถือ
จากนั้นในปี 2020 ทีม OpenAI ได้เปิดตัว GPT-3 ซึ่งพัฒนาต่อจาก GPT-2 จุดเด่นของ GPT-3 คือความสามารถในการทำงานที่มีความเชื่อถือได้สูง และสามารถสร้างข้อความที่สมเหตุสมผลและถูกต้องมากยิ่งขึ้น เนื่องจากโมเดลที่ใหญ่ขึ้น มีพารามิเตอร์มากถึง 175 พันล้านตัว และถูกฝึกสอนด้วยข้อมูลที่เพิ่มขึ้นมากกว่าสองรุ่นก่อนหน้า [1] ซึ่งโมเดล GPT-3 และ GPT-3.5 เป็นรุ่นที่เปิดให้บุคคลทั่วไปได้ทดลองใช้งาน ด้วยรูปแบบฟังก์ชั่นหลักๆ คือการเขียนข้อความ หรือตอบคําถามจากผู้ใช้งาน โดยตัวระบบเรียนรู้ที่จะตอบได้อย่างเป็นธรรมชาติมาก และใกล้เคียงกับมนุษย์
ล่าสุดเมื่อวันที่ 14 มีนาคม 2023 ทีมวิจัย OpenAI ได้เปิดตัว GPT-4 ซึ่งเป็นรุ่นอัพเกรดล่าสุด ซึ่งยังไม่ได้เปิดให้บุคคลทั่วไปเข้าใช้งาน ข้อแตกต่างระหว่างรุ่น 4 และ 3 คือ มีความแม่นยำและถูกต้องมากยิ่งขึ้น มีความสามารถในการบรรยายภาพ มีความเชี่ยวชาญเฉพาะทางมากยิ่งขึ้น เป็นต้น อย่างไรก็ตาม ผู้คิดค้นและพัฒนา ChatGPT ก็ยอมรับว่าโมเดลมีข้อจำกัดและยังไม่สามารถเชื่อถือได้อย่างสมบูรณ์
.
ตัวอย่างการใช้งาน ChatGPT ในงานวิจัย
*การใช้ ChatGPT กับงานเขียนบทความทางวิชาการ (ผ่าน https://chat.openai.com/)*
ChatGPT สามารถใช้เป็นเครื่องมือในการทำวิจัย ค้นคว้าหาข้อมูล ตลอดจนใช้ในการช่วยเขียนบทความทางวิชาการได้อยู่บ้าง แต่ต้องใช้ด้วยความระมัดระวัง เพื่อให้อยู่ภายใต้นโยบายของสำนักพิมพ์
จากข้อมูลอัพเดทล่าสุดในปี 2023 สำนักพิมพ์ชื่อดังอย่าง Nature, Springer-Nature, Elsevier และ Taylor and Francis ได้มีการปรับนโยบายการเป็นผู้เขียน (authorship) ระบุไม่ให้ ChatGPT มีชื่อเป็นผู้เขียนหลักหรือผู้เขียนร่วมในบทความทางวิชาการ [2-4] หากนักวิจัยใดใช้เครื่องมือเหล่านี้จะต้องระบุการใช้งานในส่วนที่เหมาะสม เช่น “methodology” หรือ “acknowledgment” อย่างไรก็ดี ถึงแม้ว่าเราไม่สามารถให้ ChatGPT เป็นผู้เขียนได้ แต่เราสามารถใช้เป็นเครื่องมือในการช่วยเกลาบทความได้ หากแต่เราต้องตรวจเช็คความถูกต้องของเนื้อหาอย่างรอบคอบด้วย นอกจากนั้น ด้วยการที่มันเรียนรู้จากฐานข้อมูลจำนวน ChatGPT อาจมีการคัดลอกข้อความบางส่วนมาจากแหล่งที่มาต่างๆ ซึ่งจะนำไปสู่ plagiarism ได้ จึงจำเป็นต้องมีการเช็คในส่วนนี้ด้วย
ต่อไปจะขอยกตัวอย่างบทความ ชื่อเรื่องว่า “Is ChatGPT a Reliable Source for Writing Review Articles in Catalysis Research? A Case Study on CO2 Hydrogenation to Higher Alcohols” [5] ผู้เขียนลองให้ ChatGPT ช่วยวางโครงเรื่องของรีวิวเปเปอร์ในหัวข้อที่กำหนด แล้วก็ใช้ ChatGPT เติมข้อมูลทั้งหมดตาม outline ที่มันเสนอมา จากนั้นผู้เขียนก็นำข้อมูลที่ได้มาเปรียบเทียบกับเปเปอร์ที่ผ่าน peer review ในหัวข้อเดียวกัน ก็พบว่าข้อมูลที่ ChatGPT นำเสนอมานั้น มีโครงสร้างที่คล้ายกับรีวิวเปเปอร์ทั่วไป แต่ยังขาดข้อมูลเชิงลึกที่สำคัญ เช่น กลไกการเกิดปฏิกิริยา
นอกจากนี้ ChatGPT ที่เป็น text-based AI model ยังไม่สามารถใช้ช่วยเขียนตารางหรือเขียนกราฟสำหรับข้อมูลจากผลงานวิจัยเฉพาะทาง และที่แย่ไปกว่านั้นคือ ChatGPT ยังไม่สามารถอ้างอิงที่มาของเนื้อหา (ก็คือยังไม่สามารถ cite ไปยังบทความอื่นได้) ทำให้ยากต่อการเช็คว่าเนื้อหานั้นมีความถูกต้องขนาดไหน เพราะไม่ทราบแหล่งที่มา และเนื้อหาข้อความที่ ChatGPT เขียนขึ้นนั้นในหลายส่วนยังไม่ถูกต้องนักและมีความคลาดเคลื่อนในเชิงเทคนิคอยู่มาก
ยกตัวอย่างเช่น ChatGPT เขียนเกี่ยวกับกลไกการเกิดปฏิกิริยา CO2 Hydrogenation (การเติมไฮโดรเจนให้กับ CO2) เป็นแอลกอฮอล์ว่า CO2 + 2H2 → CH3OH ซึ่งเป็นเพียงกรณีหนึ่งที่เกิดขึ้นได้ของปฏิริยา CO2 Hydrogenation แต่เมื่อถามนักเคมีที่มีความรู้และความเชี่ยวชาญจะเขียนสมการรูปทั่วไปของปฏิกิริยานี้ได้เป็น nCO2 + 3nH2 → CnH2n+1OH +(2n-1)H2O จะเห็นได้ว่านักเคมีสามารถให้คำตอบที่ครบถ้วนมากกว่า โดยเฉพาะสำหรับงานที่ต้องการความเชี่ยวชาญเฉพาะทาง ChatGPT ยังต้องอาศัยการพัฒนาและเรียนรู้อีกมาก
.
*การใช้ ChatPDF – ChatGPT to PDF ให้อ่านบทความทางวิชาการ พร้อมตอบคำถามและสรุปประเด็นสำคัญ (ผ่าน https://www.chatpdf.com/)*
ตัวอย่างถัดไป เราจะมาลองใช้ ChatPDF ซึ่งเป็นแชทบอทของ ChatGPT ที่รับข้อมูลจากไฟล์เอกสาร PDF ซึ่งผู้ใช้ต้องการให้สรุป ถามคำถามเกี่ยวกับเนื้อหา หรือช่วยอธิบายเอกสารรายงานและงานวิจัยที่ซับซ้อนได้ เป็นต้น ตัวอย่างไฟล์เอกสารที่เราเลือกมาเป็น บทความตีพิมพ์จากกลุ่มวิจัย NCAS ชื่อเรื่องว่า “Energy efficiency of bio-coal derived from hydrothermal carbonized biomass: Assessment as sustainable solid fuel for municipal biopower plant” [6] ซึ่งบทความนี้ได้เขียนลงในเพจของกลุ่มวิจัย เมื่อวันที่ 2 พฤษภาคม 2023 สามารถตามอ่านเวอร์ชั่นที่สมาชิกของเราเขียนไว้ได้ในโพสต์ก่อน ทีนี้เรามาลองให้ ChatPDF สรุปเนื้อหาจากเปเปอร์
Q: สรุปเกี่ยวกับเปเปอร์นี้
ChatPDF : “งานวิจัยนี้เน้นการใช้กระบวนการ Hydrothermal Carbonization (HTC) เพื่อผลิตไบโอคอลจากไบโอมาสจากเปลือกปาล์มและต้นไผ่ โดยมีวัตถุประสงค์เพื่อเพิ่มประสิทธิภาพในการผลิตไบโอคอลและการใช้งานเป็นเชื้อเพลิงที่มีคุณภาพสูงในโรงไฟฟ้าไบโอมาส โดยได้ศึกษาผลกระทบของอัตราส่วนไบโอมาสต่อน้ำ อุณหภูมิและเวลาปฏิกิริยา รวมถึงการเพิ่มสารเติมเพื่อเพิ่มประสิทธิภาพในการผลิต ไบโอคอลที่ได้จากกระบวนการ HTC นี้มีคุณสมบัติที่คล้ายถ่านหินและมีความเป็นมิตรต่อสิ่งแวดล้อมมากกว่าเชื้อเพลิงจากแหล่งธรรมชาติ งานวิจัยนี้ยังพูดถึงการใช้ไบโอคอลเป็นแหล่งพลังงานทดแทนเชื้อเพลิงจากแหล่งธรรมชาติ การลดขนาดการเก็บเชื้อเพลิง ต้นทุนขนส่ง และการปลดปล่อยก๊าซ CO2 ในโรงไฟฟ้าไบโอมาส โดยไบโอคอลที่ได้จากกระบวนการ HTC นี้สามารถนำมาใช้เป็นแหล่งพลังงานทดแทนเชื้อเพลิงจากแหล่งธรรมชาติได้ โดยไม่ส่งผลกระทบต่อสิ่งแวดล้อมเช่นเดียวกับการใช้เชื้อเพลิงจากแหล่งธรรมชาติที่มีการใช้งานอย่างไม่มีวิจารณญาณ และส่งผลกระทบต่อสิ่งแวดล้อมอย่างมากในปัจจุบัน งานวิจัยนี้ได้รับการสนับสนุนจากทุนการศึกษาและทุนวิจัยต่างๆ อย่างมากมาย”
ในตัวอย่างข้างต้นเราอัพโหลดไฟล์ PDF ซึ่งเป็นภาษาอังกฤษ แต่ถามคำถามให้ ChatPDF สรุปเปเปอร์เป็นภาษาไทย จะเห็นว่า ChatPDF สามารถสรุปได้ประมาณนึง แต่อาจจะไม่แม่นยำถูกต้องมากนักในเชิงเทคนิค และถ้าเปรียบเทียบกับการถามตอบเป็นภาษาอังกฤษ เราพบว่าภาษาไทยจะใช้เวลามากกว่าภาษาอังกฤษ และภาษาที่เขียนในหลายส่วนอาจจะไม่ได้อ่านแล้วลื่นไหล อ่านแล้วยังสะดุดเพราะแปลตรงเกินไป ซึ่งอาจจะเกิดจากที่การเรียนรู้ของโมเดลด้วยภาษาไทยยังต้องการการพัฒนาต่อไปให้ดียิ่งขึ้น
นอกจากความสามารถข้างต้นแล้ว โมเดลตระกูล ChatGPT ยังสามารถช่วยร่างจดหมาย ช่วยเขียนอีเมล์สมัครงาน ช่วยเขียนโค้ดในการเขียนโปรแกรมคอมพิวเตอร์ เขียนบทละคร อธิบายเกี่ยวกับสมการทางคณิตศาสตร์ และอื่นๆ อีกมากมายที่ยังมีคนทดลองใช้งานกันต่อไป อย่างไรก็ตามความรู้ของ ChatGPT สร้างมาจากฐานข้อมูลจนถึงปี 2021 นั่นหมายความว่าคำถามหรือการค้นหาบางอย่างในปัจจุบัน ChatGPT (เวอร์ชั่นที่บุคคลทั่วไปทดลองใช้งาน) ยังไม่สามารถตอบได้ และถึงแม้ตอบได้ก็อาจจะไม่ได้ถูกต้องนัก ทั้งหมดเหล่านี้ยังต้องการการพิสูจน์และพัฒนาต่อไป ไม่แน่ว่าวันนึงอาจใช้ทำงานแทนมนุษย์เลยก็เป็นได้
เรียบเรียงโดย Nanoinformatics and Artificial Intelligence Research Team, NCAS
https://www.nanotec.or.th/…/artificial-intelligence/
ดร. มนฤดี เลี้ยงรักษา, ดร. อิทธิ ฉัตรนันทเวช, ดร. กนกกร พิมพ์เจริญ, ดร. สุรัฐ ธีรพิทยานนท์
ภาพประกอบสร้างโดย ใช้ chatGPT เขียน prompt สรุปเนื้อหาจากบทความ และป้อนเข้า stable diffusion (https://clipdrop.co/stable-diffusion)
#NCASresearch #ChatGPT #AI
เอกสารอ้างอิง
1. [https://en.wikipedia.org/wiki/Large_language_model]
2. Else, H., Abstracts written by ChatGPT fool scientists. Nature, 2023. 613(7944): p. 423.
3. Stokel-Walker, C., ChatGPT listed as author on research papers: many scientists disapprove. Nature, 2023. 613(7945): p. 620-621.
4. Dwivedi, Y.K., et al., Opinion Paper: “So what if ChatGPT wrote it?” Multidisciplinary perspectives on opportunities, challenges and implications of generative conversational AI for research, practice and policy. International Journal of Information Management, 2023. 71: p. 102642.
5. Zhong, Q., et al., Is ChatGPT a Reliable Source for Writing Review Articles in Catalysis Research? A Case Study on CO2 Hydrogenation to Higher Alcohols. 2023, Preprints.org.
6. Sattasathuchana, S., et al., Energy efficiency of bio-coal derived from hydrothermal carbonized biomass: Assessment as sustainable solid fuel for municipal biopower plant. Applied Thermal Engineering, 2023. 221: p. 119789.
https://m.facebook.com/story.php?story_fbid=pfbid0ogW1CbcJJtJvsnbSoRqXS4sbaUaQnzxuavxEBuXTFGQv57CJDdd4HJxU66X5odtMl&id=100076463822982&mibextid=qC1gEa