กลุ่ม SCBX ผนึกกำลัง SambaNova เพิ่ม “ไต้ฝุ่น” โมเดลภาษาไทยขนาดใหญ่

   เมื่อ : 10 ก.ค. 2567

กลุ่ม SCBX นำโดย เอสซีบี เอกซ์ (SCBX) และเอสซีบี เท็นเอกซ์ (SCB 10X) เดินหน้าผลักดันระบบนิเวศและคอมมูนิตี้ AI ในประเทศไทยอย่างต่อเนื่องเพื่อตอกย้ำความมุ่งมั่นของกลุ่ม SCBX ในการเป็นองค์กรที่ขับเคลื่อนด้วย AI หรือ AI-First Organization  ล่าสุด ผนึกกำลัง SambaNova Systems บริษัทผู้ให้บริการโซลูชันด้าน Generative AI ที่รวบรวมโมเดลที่เร็วที่สุด และ Chips ที่ทันสมัยที่สุด นำ "ไต้ฝุ่น” (Typhoon) โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) เปิดให้บริการบนแพลตฟอร์ม Samba-1 Composition of Experts (CoE) เพื่อให้นักพัฒนา AI ทั่วโลกสามารถใช้ต่อยอดและพัฒนาแอปพลิเคชันด้าน AI บนแพลตฟอร์ม Samba-1 ได้แล้ววันนี้

 

นายกสิมะ ธารพิพิธชัย Head of AI Strategy บริษัท เอสซีบี เท็นเอกซ์ จำกัด (SCB 10X) กล่าวว่า “เรารู้สึกยินดีเป็นอย่างยิ่งที่ “ไต้ฝุ่น” โมเดลภาษาไทยขนาดใหญ่ (Thai Large Language Model) ได้เข้าร่วมเป็นส่วนหนึ่งของ Samba-1 และพร้อมให้บริการแก่ลูกค้าของ SambaNova ทั่วโลก โดยเราเชื่อมั่นว่า Samba-1 จะช่วยให้โมเดล  “ไต้ฝุ่น” เข้าถึงนักพัฒนานวัตกรรมและแอปพลิเคชันด้าน AI ภาษาไทยได้มากขึ้น”

 

ล่าสุด “ไต้ฝุ่น” ได้เปิดตัวเวอร์ชัน Typhoon-1.5X ในขนาด 8B และ 70B พัฒนาต่อยอดจากโมเดล Llama3 โมเดลถูกปรับแต่งให้เหมาะสำหรับภาษาไทยโดยมีเทคนิคการฝึกอบรมเพื่อให้เข้าใจบริบทและวัฒนธรรมไทยให้ดียิ่งขึ้น มีประสิทธิภาพเทียบเท่ากับโมเดลชั้นนำอย่าง ChatGPT และ GPT-4 นับเป็นก้าวหน้าที่สำคัญของ NLP และ AI ภาษาไทย

 

"ไต้ฝุ่น” เปิดให้ใช้งานในรูปแบบ Open Beta ใน 2 รูปแบบ ได้แก่ 1. Pretrained Model โมเดลข้อมูลด้านภาษาไทย ครอบคลุมคำศัพท์ บริบท หรือความแตกต่างทางวัฒนธรรม รวมถึงความรู้ทั่วไปที่เกิดขึ้นทั่วโลก โมเดลนี้เป็น Open Source ที่นักพัฒนาด้าน AI สามารถดาวน์โหลดได้ฟรีเพื่อนำไปใช้พัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI   2. Instruction-tuned Model โมเดลที่ต่อยอดจาก Pretraining สามารถทำตามคำสั่งที่ป้อนเข้าไป เช่น การแปล การสรุปความ หรือการตอบคำถามได้ดียิ่งขึ้น โดยสามารถเข้าถึงได้ผ่านบริการ API

 

ด้าน นายกวีวุฒิ เต็มภูวภัทร Head of R&D and Innovation Lab บริษัท เอสซีบี เอกซ์ จำกัด (มหาชน) หรือ SCBX กล่าวว่า “ไต้ฝุ่น” โมเดลภาษาขนาดใหญ่ (Large Language Model หรือ LLM) ถูกพัฒนาขึ้นมาเพื่อแก้ปัญหาที่มักเจอเมื่อใช้งานโมเดลภาษาขนาดใหญ่ที่พัฒนาโดยชาวต่างชาติและถูกฝึกฝนเป็นภาษาอังกฤษเป็นหลัก เช่น การให้ข้อมูลภาษาไทย แต่ไม่ถูกกับบริบทหรือวัฒนธรรมของคนไทย เป็นต้น อีกทั้งภาษาไทยถูกเก็บข้อมูลสำหรับใช้พัฒนาโมเดลภาษาไว้น้อยมาก (Low Resource Language)  เช่นเดียวกับภาษาอื่นๆ ในภูมิภาคเอเชียตะวันออกเฉียงใต้ ทำให้เกิดปัญหาช่องว่างทางภาษา เราเชื่อว่าการนำโมเดล “ไต้ฝุ่น” ไปอยู่บน Samba-1 จะช่วยให้นักพัฒนาด้าน AI ได้รับประสบการณ์ (User Experience) ที่ดีขึ้น พร้อมมีส่วนช่วยยกระดับนวัตกรรมด้าน AI และเสริมสร้างความแข็งแกร่งให้แก่อุตสาหกรรม AI ของไทย”

 

ขณะที่ มร.โรดริโก เหลียง (Rodrigo Liang) ผู้ร่วมก่อตั้งและ CEO ของ SambaNova Systems กล่าวว่า “Samba-1 นำเสนอโมเดล Open Source ที่ทันสมัยที่สุด ซึ่งช่วยให้นักพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI เข้าถึงโมเดล AI ที่ดีที่สุดและเร็วที่สุดในโลก โดยการเข้าร่วมของ “ไต้ฝุ่น” ครั้งนี้สอดคล้องกับกลยุทธ์ของเรา อีกทั้งเรายินดีเป็นอย่างยิ่งที่จะได้นำ “ไต้ฝุ่น” เข้าสู่ Samba-1 ร่วมกับโมเดลชั้นนำระดับโลก” 

 

“นักพัฒนาด้าน AI ในอุตสาหกรรมต่างๆ รวมถึงอุตสาหกรรมด้านการเงินการธนาคารจะมีแพลตฟอร์มใหม่ที่ช่วยเพิ่มศักยภาพในการพัฒนาแอปพลิเคชันและนวัตกรรมด้าน AI ของพวกเขา การนำโมเดล “ไต้ฝุ่น” มาอยู่บนแพลตฟอร์ม Samba-1 Composition of Experts จะช่วยส่งเสริมประสิทธิภาพของโมเดล “ไต้ฝุ่น” และลดต้นทุนการใช้งานให้น้อยลงกว่าที่เคย” มร.มาร์แชล ชอย (Marshall Choy) SVP Product ของ SambaNova Systems กล่าวเสริม

 

“ไต้ฝุ่น” ได้เป็นส่วนหนึ่งของแพลตฟอร์ม Samba-1 Composition of Experts ซึ่งเป็นเอกลักษณ์เฉพาะของ SambaNova ที่รวบรวมโมเดลสำหรับพัฒนานวัตกรรมด้าน AI ที่หลากหลายและสามารถแนะนำโมเดลเฉพาะทางที่ตอบโจทย์ผู้ใช้งานได้อย่ามีประสิทธิภาพและตรงกับความต้องการผู้ใช้งาน นอกจากนี้ “ไต้ฝุ่น” ทำงานบนชิป SN40L ของ SambaNova ด้วยหน่วยความจำ Dataflow 3 ชั้น ซึ่งช่วยให้การประมวลผลข้อมูลมีประสิทธิภาพมากยิ่งขึ้น