กรุงเทพฯ 29 มิถุนายน 2569 – กลุ่ม SCBX ได้เสริมสร้างความแข็งแกร่งในฐานะผู้นำด้านเทคโนโลยีทางการเงิน โดยเดินหน้าความมุ่งมั่นในการวิจัยล้ำสมัยจนได้รับการยอมรับในระดับโลก ล่าสุด นักวิจัยด้าน AI ของกลุ่ม SCBX ได้สร้างความสำเร็จครั้งสำคัญอีกครั้ง ด้วยผลงานวิจัย 5 เรื่องที่ได้รับการตีพิมพ์ในงานประชุมวิชาการระดับโลกชั้นนำ 4 งาน ได้แก่ ACL 2026 (งานประชุมหลัก), EACL 2026 (งานประชุมหลัก), ICLR 2026 Workshop on Principled Design for Trustworthy AI และ ICLR 2026 Blogposts Track งานประชุมเหล่านี้ได้รับการยอมรับอย่างกว้างขวางว่าเป็นเวทีสำคัญในระบบนิเวศการวิจัย AI ระดับโลก ซึ่งบริษัทเทคโนโลยีชั้นนำต่างๆ เช่น Google, Microsoft, Amazon และ Apple ต่างก็เผยแพร่ผลงานล้ำสมัยเป็นประจำ ความสำเร็จนี้เน้นย้ำถึงความลึกและความกว้างของศักยภาพการวิจัยของ SCBX รวมถึงการเติบโตของบุคลากรด้าน AI ชาวไทยในระดับนานาชาติ
ความสำเร็จนี้สะท้อนให้เห็นถึงความร่วมมืออย่างใกล้ชิดระหว่างทีมวิจัยต่างๆ ภายในกลุ่ม SCBX ซึ่งรวมถึง SCBX และ SCB DataX ความพยายามร่วมกันนี้มุ่งเน้นไปที่การพัฒนา AI ในสามเสาหลักเชิงกลยุทธ์ด้านการวิจัย ซึ่งตอบสนองทั้งความต้องการเฉพาะของผู้ใช้ชาวไทยและการพัฒนาองค์ความรู้ด้าน AI ในระดับโลกในวงกว้าง:
การเพิ่มประสิทธิภาพและความปลอดภัยของ AI ในบริบทภาษาและวัฒนธรรมไทย
การพัฒนาความสามารถด้านภาษาเสียงเพื่อการใช้งานจริง และ
การพัฒนางานวิจัยพื้นฐานเชิงลึกด้านการให้เหตุผลสำหรับแบบจำลองภาษาขนาดใหญ่ (LLMs)
สมาคมภาษาศาสตร์เชิงคำนวณ (ACL) และสาขาในยุโรป EACL ได้รับการยอมรับในระดับโลกในฐานะเวทีชั้นนำด้านการประมวลผลภาษาธรรมชาติ (NLP) ซึ่งเป็นสาขาที่อยู่เบื้องหลังระบบต่างๆ เช่น ChatGPT, Gemini และ Claude ในขณะเดียวกัน การประชุมนานาชาติว่าด้วยการเรียนรู้การนำเสนอ (ICLR) ยังคงเป็นเวทีชั้นนำสำหรับการค้นพบที่สำคัญในด้านการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึก โดยส่วน Blogposts Track ของการประชุมนี้ทำหน้าที่เป็นช่องทางคัดสรรสำหรับการเผยแพร่ข้อมูลเชิงเทคนิคที่มีผลกระทบสูงไปยังชุมชนวิจัยทั่วโลก
คุณกวีวุฒิ เทมพูวาพัฒน์ ประธานเจ้าหน้าที่ฝ่ายนวัตกรรมของ SCBX และประธานเจ้าหน้าที่บริหารของ SCB 10X กล่าวว่า “เรารู้สึกเป็นเกียรติอย่างยิ่งที่งานวิจัยของเราได้รับการยอมรับในงานประชุมวิชาการระดับโลกชั้นนำ เช่น ACL, EACL และ ICLR ซึ่งเป็นเวทีที่ขึ้นชื่อเรื่องการตรวจสอบโดยผู้ทรงคุณวุฒิอย่างเข้มงวดและมาตรฐานระดับสูง ความสำเร็จครั้งนี้สะท้อนให้เห็นถึงความมุ่งมั่นอย่างต่อเนื่องของ SCBX ในการพัฒนาการวิจัยระดับแนวหน้าอย่างต่อเนื่อง”
“เอกสารทั้งห้าฉบับนี้เน้นย้ำถึงแนวทางการพัฒนา AI ของเรา ซึ่งก้าวข้ามขีดจำกัดของความสามารถด้านโมเดล โดยมุ่งเน้นสามมิติที่สำคัญ ได้แก่ การใช้งานจริงในบริบทภาษาไทย ความปลอดภัยและความน่าเชื่อถือในระดับระบบ และการลงทุนอย่างลึกซึ้งในการวิจัยพื้นฐาน องค์ประกอบเหล่านี้มีความสำคัญอย่างยิ่งสำหรับการนำ AI ไปใช้ในสภาพแวดล้อมที่ต้องการความน่าเชื่อถือสูง เช่น บริการทางการเงิน” คุณกวีวุฒิ กล่าวเสริม
ความสำเร็จนี้ตอกย้ำกลยุทธ์ระยะยาวของ SCBX ในการลงทุนวิจัยเชิงลึกเพื่อสร้างองค์ความรู้และนวัตกรรมที่มีประโยชน์ในโลกแห่งความเป็นจริง ในขณะเดียวกัน กลุ่มบริษัทยังคงส่งเสริมแนวทางการวิจัยแบบเปิดกว้าง สนับสนุนความร่วมมือระหว่างสถาบันการศึกษาและภาคอุตสาหกรรม เพื่อเร่งสร้างขีดความสามารถภายในระบบนิเวศ AI ของประเทศไทย
โดยรวมแล้ว ผลงานวิจัยเหล่านี้ถือเป็นอีกก้าวหนึ่งในการวางตำแหน่งประเทศไทยให้เป็นศูนย์กลางนวัตกรรมปัญญาประดิษฐ์ในระดับภูมิภาค โดยพัฒนาเทคโนโลยีที่มีความเกี่ยวข้องกับท้องถิ่น ปลอดภัย และสร้างผลกระทบในระดับโลก
ผลงานวิจัย 5 ด้านของ SCBX ที่โดดเด่นในระดับโลก:
การเพิ่มประสิทธิภาพโทเค็นที่คำนึงถึงภาษา (LATB)
บทความที่ได้รับการยอมรับให้ตีพิมพ์ในงานประชุม ACL 2026 (การประชุมหลัก) นำเสนอเทคนิคใหม่ที่เรียกว่า Language-Aware Token Boosting (LATB) ซึ่ง ออกแบบมาเพื่อแก้ไขปัญหาทั่วไปในการใช้งาน LLM ภาษาไทย นั่นคือ การเบี่ยงเบนทางภาษา (language drift ) ซึ่งโมเดลจะตอบสนองเป็นภาษาอังกฤษหรือผสมภาษาแม้ว่าคำถามจะเป็นภาษาไทย ส่งผลให้ผู้ใช้ได้รับประสบการณ์ที่ไม่เป็นธรรมชาติ
LATB ช่วยลดปัญหาดังกล่าวได้อย่างมีนัยสำคัญ โดยไม่ต้องปรับแต่งโมเดลเพิ่มเติม ลดทั้งต้นทุนการคำนวณและเวลาในการพัฒนา ในขณะเดียวกันก็ช่วยให้การใช้งานจริงมีประสิทธิภาพมากขึ้นและมอบประสบการณ์การใช้งานภาษาไทยที่สม่ำเสมอยิ่งขึ้น
ThaiSafetyBench: การเปรียบเทียบมาตรฐานความปลอดภัยของ AI ในบริบทของประเทศไทย
บทความที่ได้รับการยอมรับให้เข้าร่วมการประชุมเชิงปฏิบัติการ ICLR 2026 หัวข้อ " การออกแบบอย่างมีหลักการสำหรับ AI ที่น่าเชื่อถือ" นำเสนอ ThaiSafetyBench ซึ่งเป็นเกณฑ์มาตรฐานด้านความปลอดภัยสำหรับแบบจำลองภาษาขนาดใหญ่ (LLM) ที่ออกแบบมาโดยเฉพาะสำหรับบริบทภาษาและวัฒนธรรมไทย
ปัจจุบัน การประเมินความปลอดภัยของ AI ทั่วโลกยังคงพึ่งพาเกณฑ์มาตรฐานที่เน้นภาษาอังกฤษเป็นหลัก ทำให้ความเสี่ยงเฉพาะบริบท เช่น ความเสี่ยงที่เกี่ยวข้องกับบรรทัดฐานทางสังคม วัฒนธรรม และค่านิยมท้องถิ่นของไทย ยังไม่ได้รับการพิจารณาอย่างเพียงพอ ส่งผลให้องค์กรในประเทศไทยขาดเครื่องมือมาตรฐานในการประเมินว่าระบบ AI มีความปลอดภัยเพียงพอสำหรับการใช้งานจริงในบริบทของไทยหรือไม่
ThaiSafetyBench แก้ปัญหาช่องว่างนี้ด้วยชุดข้อมูล ตัวอย่างทดสอบภาษาไทยจำนวน 1,954 ตัวอย่าง ครอบคลุม 6 หมวดหมู่ความเสี่ยงและ 17 ประเภทอันตราย ทีมวิจัยได้ประเมินโมเดล AI ชั้นนำมากกว่า 24 โมเดล รวมถึง Claude Sonnet 4.5, GPT-5, Gemini, Llama, Gemma และ Qwen ตลอดจนโมเดลที่พัฒนาขึ้นในท้องถิ่น เช่น Typhoon และ OpenThaiGPT
การศึกษาพบว่า การโจมตีที่คำนึงถึงบริบททางวัฒนธรรมมีอัตราความสำเร็จสูงกว่าการโจมตีทั่วไปอย่างมีนัย สำคัญ ซึ่งชี้ให้เห็นถึงจุดอ่อนที่สำคัญในระบบ AI ในปัจจุบันที่ยังไม่ได้รับการแก้ไขในระดับโลก
เพื่อสนับสนุนการพัฒนาระบบนิเวศในวงกว้าง ทีมงานได้เผยแพร่ชุดข้อมูล ตารางจัดอันดับ และเครื่องมือตรวจจับเนื้อหาที่เป็นอันตราย ThaiSafetyClassifier ในรูปแบบ โอเพนซอร์ส เพื่อให้นักวิจัยและนักพัฒนาทั่วประเทศไทยสามารถร่วมกันพัฒนามาตรฐานความปลอดภัยของ AI ได้
AudioJudge: การประเมินคุณภาพเสียงแบบครบวงจรโดยใช้โมเดลเสียงขนาดใหญ่
บทความที่ได้รับการยอมรับให้ตีพิมพ์ใน งาน EACL 2026 (การประชุมหลัก) ซึ่งนำเสนอโดยทีม Typhoon จาก SCB DataX ได้แนะนำ AudioJudge ซึ่งเป็นเฟรมเวิร์กที่ใช้ประโยชน์จากโมเดลเสียงขนาดใหญ่ (LAMs) เป็นตัวประเมินแบบรวมศูนย์เพื่อประเมินมิติต่างๆ ของเสียงพูดพร้อมกัน รวมถึงการออกเสียง อัตราการพูด การระบุตัวผู้พูด และคุณภาพเสียง ซึ่งช่วยลดความจำเป็นในการใช้ระบบเฉพาะทางแยกต่างหาก
ระบบประเมินเสียง AudioJudge ที่เสนอมานี้ ซึ่งประกอบด้วยหลายแง่มุม สามารถบรรลุค่าสัมประสิทธิ์สหสัมพันธ์สเปียร์แมนได้สูงถึง 0.91 ซึ่งสอดคล้องกับการตัดสินของมนุษย์อย่างใกล้เคียง ถือเป็นก้าวสำคัญในการพัฒนาระบบประเมินที่สะท้อนการรับรู้ของมนุษย์ได้อย่างแม่นยำยิ่งขึ้น
การขยายบริบทเสียงเพื่อความเข้าใจเนื้อหาแบบยาว
บทความอีกฉบับจากทีม Typhoon (SCB DataX) ซึ่งได้รับการยอมรับให้ตีพิมพ์ใน งาน EACL 2026 (การประชุมหลัก) กล่าวถึงปัญหาคอขวดสำคัญในแบบจำลองภาษาเสียงขนาดใหญ่ (LALM) ซึ่งโดยทั่วไปแล้วจะมีข้อจำกัดด้านการรับข้อมูลเสียงในระยะเวลาสั้นๆ แม้ว่าจะมีศักยภาพในการรองรับบริบทข้อความที่ยาวกว่าก็ตาม งานวิจัยนี้ได้นำเสนอ Partial YaRN ซึ่งเป็นวิธีการแยกส่วนโมดาลิตี้สำหรับการขยายบริบทเสียงโดยไม่ส่งผลกระทบต่อประสิทธิภาพของข้อความ ควบคู่ไปกับการฝึกอบรมเสียงแบบยาวเสมือนจริง (VLAT) ซึ่งช่วยให้แบบจำลองสามารถปรับใช้ได้อย่างมีประสิทธิภาพกับลำดับเสียงที่ยาวขึ้น ความก้าวหน้าเหล่านี้ปูทางไปสู่การใช้งานจริงที่ต้องการความเข้าใจเสียงแบบยาว รวมถึงการประชุม การดำเนินงานศูนย์บริการลูกค้า และการประมวลผลเนื้อหาเสียงขนาดใหญ่
เดี๋ยวก่อน เราจำเป็นต้องรอไหม? การทบทวนการบังคับงบประมาณสำหรับการปรับขนาดเวลาทดสอบแบบลำดับ
บทความที่ได้รับการยอมรับให้ตีพิมพ์ใน ICLR 2026 Blogposts Track ได้ทำการตรวจสอบ Budget Forcing อีกครั้ง ซึ่งเป็นเทคนิคการเพิ่มประสิทธิภาพการให้เหตุผลของ LLM โดยการควบคุม “งบประมาณการคิด” และกระตุ้นให้เกิดการให้เหตุผลอย่างต่อเนื่องด้วยคำใบ้ต่างๆ เช่น “รอ” จากการประเมินอย่างเป็นระบบในตระกูลโมเดลหลายตระกูล ได้แก่ Qwen, Llama, Gemma และ Mistral การศึกษาพบว่าประสิทธิภาพที่เพิ่มขึ้นนั้นไม่เป็นเชิงเส้น ซึ่งท้าทายสมมติฐานเดิม และ “รอ” ไม่ใช่คำกระตุ้นที่มีประสิทธิภาพที่สุดเสมอไป แต่คำที่ใช้บ่อยตามธรรมชาติ เช่น “ปล่อย” หรือ “บางที” มักให้ผลลัพธ์ที่ดีกว่า งานวิจัยนี้ให้แนวทางปฏิบัติที่เป็นประโยชน์สำหรับการปรับขนาดเวลาทดสอบ และนำเสนอข้อมูลเชิงลึกใหม่ๆ แก่ชุมชนวิจัย AI ทั่วโลก
ผู้อ่านสามารถเข้าถึงข้อมูลเชิงลึกด้าน AI และ FinTech ข้อมูลอัปเดตทางเทคโนโลยี และเนื้อหาล่าสุดจาก SCBX Knowledge Hub ผ่านทาง SCBX R&D LINE OA ได้ที่ : https://lin.ee/8dvXKVs












ไม่มีความคิดเห็น:
แสดงความคิดเห็น