เบื้องหลังเทคโนโลยี:
อุตสาหกรรมบริการอัจฉริยะเริ่มต้นที่นี่

Gen AI เป็นที่ยอมรับและถูกใช้งานอย่างแพร่หลายรวดเร็วยิ่งกว่าที่สมาร์ตโฟนและแท็บเล็ตเคยทำได้ โดยคาดว่าภายในปี 2030 จะมาช่วยเพิ่มมูลค่าให้เศรษฐกิจโลกกว่า 15.7 ล้านล้านดอลลาร์สหรัฐ สูงกว่ามูลค่าตลาดรวมในปัจจุบันของจีนและอินเดีย

เหตุผลที่เรามุ่งมั่น

เราไม่ได้สร้างแค่โปรดักต์ แต่เรากำลังสร้างนิยามใหม่ให้ประสบการณ์ผู้ใช้ ตั้งแต่ผู้ช่วย AI ระบบเสียงที่เข้าใจง่าย
ไปจนถึงแพลตฟอร์มจัดการงานร่วมกัน ทุกโซลูชันของเราถูกออกแบบมาให้ตอบโจทย์ได้เกินความคาดหมาย    
เพราะเรามั่นใจว่า AI ไม่ควรทำงานอย่างโดดเดี่ยว สิ่งสำคัญไม่ได้อยู่ที่แอปพลิเคชัน การเชื่อมต่อกับ API หรือความสะดวกสบาย เพราะสิ่งเหล่านั้นคือเรื่องพื้นฐานที่ควรทำได้

สิ่งที่ AI ช่วยยกระดับ

ประสิทธิภาพที่ยิ่งใหญ่

คุณภาพชีวิตที่ดีกว่า

ผลลัพธ์สำคัญ

วิธีการของเรา

ด้วยความก้าวหน้าของการประมวลผลภาษาธรรมชาติ (NLP) เทคโนโลยีควบคุมด้วยเสียงได้พัฒนาอย่างก้าวกระโดดตั้งแต่การเปิดตัว Siri ของ Apple

ที่ Aiello เราได้ยกระดับเทคโนโลยีนี้ไปอีกขั้นด้วยการใช้ระบบความเข้าใจภาษาธรรมชาติหลายรูปแบบ (Multi-model Natural Language Understanding หรือ NLU) และกรอบการเรียนรู้เชิงลึกด้านการจัดการข้อมูลและความรู้ (Data & Knowledge Management)
จากบทสนทนาเพียงเส้นเดียว โมเดลของเราสามารถเข้าใจเจตนาหลายประการและติดตามผลด้วยการดำเนินการหลายอย่างได้อย่างต่อเนื่องและมีเหตุผล อุปกรณ์จะทำงานตามลำดับขั้นตอนอย่างเป็นระบบ เพื่อตอบสนองความต้องการที่ซ่อนอยู่ในบทสนทนา และนิยามวิธีการที่เราสื่อสารกับเทคโนโลยีขึ้นมาใหม่

แต่ละคำถามจะถูกประมวลผลเทียบกับฐานข้อมูลกราฟความรู้ (Knowledge Graph Database หรือ GDB) ที่ผ่านการฝึกฝนเฉพาะสำหรับพาร์ตเนอร์เพื่อให้สอดคล้องกับธุรกิจ แบรนด์ และอุตสาหกรรมของพวกเขา โดยมุ่งเน้นที่เจตนาและความหมายของภาษาธรรมชาติ GDB ช่วยให้โซลูชันของเราสามารถมอบประสบการณ์การสนทนาแบบมนุษย์ที่แม่นยำสำหรับการใช้งานทางธุรกิจ

แม้ว่าระดับความชาญฉลาดนี้จะดูเรียบง่ายจากมุมมองของเรา แต่การเข้าใจบริบทอย่างลึกซึ้งนั้นช่วยยกระดับประสบการณ์ผู้ใช้ได้อย่างมาก

กระบวนการ
สนทนาด้วยเสียง

ขั้นตอนที่ 1

เทคโนโลยีรู้จำเสียงพูดอัตโนมัติ (ASR)

แปลงเสียงพูดของมนุษย์เป็นข้อความโดยอัตโนมัติ เมื่อทำงานร่วมกับฮาร์ดแวร์ของ Aiello ชุดไมโครโฟน และซอฟต์แวร์ประมวลผลเสียงบนอุปกรณ์แบบ Edge Computing ก็จะสามารถลดเสียงรบกวนรอบข้าง กำจัดเสียงสะท้อน และดึงคุณลักษณะของเสียงได้อย่างเต็มประสิทธิภาพ สถาปัตยกรรมนี้ช่วยให้รองรับการรู้จำหลายภาษาได้อย่างสมบูรณ์ และมอบประสบการณ์การใช้งานที่โต้ตอบได้อย่างเต็มความสามารถ

ขั้นตอนที่ 2

การเข้าใจภาษาธรรมชาติ (NLU)

การแปลความหมายของข้อความให้เข้ากับบริบทและความเข้าใจเชิงความหมายโดย AI เป็นหัวใจหลักของระบบประมวลผลข้อมูล อัลกอริทึมตัวจำแนกหลายรูปแบบ (Multi-Model Classifier) ของ Aiello จะค้นหาโมเดลภาษาขนาดใหญ่ (LLMs) ที่เหมาะสมที่สุดสำหรับตอบสนองคำขอแต่ละประเภทของธุรกิจ แม้ในกรณีที่ความหมายซับซ้อน โซลูชัน NLU ของ Aiello จะกระตุ้นการถามตอบแบบมนุษย์ เพื่อค้นพบเจตนาของผู้พูด เข้าใจคำถามของผู้ใช้ได้อย่างรวดเร็ว และลดข้อผิดพลาดในการประเมินผลในอนาคต ซึ่งเป็นเทคโนโลยี Voice-User-Interface ที่ Aiello พัฒนามาอย่างต่อเนื่อง

ขั้นตอนที่ 3

เทคโนโลยีสังเคราะห์เสียงพูด
(Text-to-Speech หรือ TTS)

เทคโนโลยีนี้สังเคราะห์เสียงพูดที่เป็นธรรมชาติ คล้ายเสียงมนุษย์ทั้งในด้านการออกเสียงและความลื่นไหล โดยแปลงข้อความเป็นเสียงพูดเทียม เฟรมเวิร์ก Neural TTS ของ Aiello รองรับมากกว่า 40 ภาษาและสำเนียง พร้อมรูปแบบเสียงให้เลือกมากกว่า 220 แบบ เพื่อมอบประสบการณ์ผู้ใช้ที่ไม่เหมือนใครและเข้าถึงมากยิ่งขึ้น ช่วยให้พาร์ตเนอร์ของเราปรับแต่งการโต้ตอบระหว่างมนุษย์และอุปกรณ์ในขั้นตอนสุดท้ายได้อย่างลงตัว

เรียนรู้ข้อมูลเพิ่มเติมเกี่ยวกับเทคโนโลยีและทางออกของเรา

ขอรับการสาธิต (demo)