กรุงเทพฯ, วันที่ 9 พฤศจิกายน 2566 — WiMi Hologram Cloud Inc. (NASDAQ: WIMI) (“WiMi” หรือ “บริษัท”) ให้บริการเทคโนโลยีฮอโลแกรมเสริมความจริง (AR) ระดับโลก ได้ประกาศว่าได้ใช้ข้อมูลหลายโหมดเพื่อชดเชยข้อมูลที่ขาดแคลนจากข้อมูลโหมดเดียว วิธีการจําแนกความหมายขึ้นกับการผสานข้อมูลหลายโหมดได้ถูกเสนอเพื่อปรับปรุงความแม่นยําของการจําแนกความหมาย การผสานข้อมูลหลายโหมดหมายถึงการผสานข้อมูลจากเซนเซอร์หรือโหมดต่างๆ เพื่อให้ข้อมูลที่ครบถ้วนและแม่นยํามากขึ้น
การผสานข้อมูลหลายโหมดมีความสําคัญอย่างยิ่งต่อการจําแนกความหมาย โดยการผสานข้อมูลหลายโหมดสามารถนําข้อมูลจากเซนเซอร์หรือโหมดต่างๆ มาใช้ และโดยการรวมข้อมูลจากโหมดต่างๆ จะสามารถใช้ประโยชน์จากข้อมูลจากโหมดต่างๆ ได้อย่างเต็มที่ เพื่อให้การแทนความหมายของลักษณะที่ครบถ้วนและมีความหมายมากขึ้น เพื่อให้ความเข้าใจถึงฉากได้อย่างครบถ้วนมากขึ้น และเพื่อปรับปรุงความแม่นยําของการจําแนกความหมาย
นอกจากนี้ การผสานข้อมูลหลายโหมดยังสามารถปรับปรุงความแม่นยําของการจําแนกความหมายได้ ภายในฉากจริง ภาพอาจถูกรบกวนจากปัจจัยเช่น การเปลี่ยนแปลงแสง การบังหน้า สัญญาณรบกวน เป็นต้น ทําให้ความแม่นยําของข้อมูลโหมดเดียวลดลง โดยการผสานข้อมูลจากโหมดหลายโหมด ผลกระทบจากปัจจัยรบกวนเหล่านี้สามารถลดลงได้ ทําให้ความมั่นคงของการจําแนกความหมายดีขึ้น และให้การสนับสนุนและแก้ปัญหางานด้านการมองเห็นด้วยคอมพิวเตอร์ได้ดีขึ้น
เทคนิคการผสานข้อมูลหลายโหมดเป็นเครื่องมือสําคัญในการปรับปรุงประสิทธิภาพของการจําแนกความหมาย วิธีการผสานระดับลักษณะ ระดับการตัดสินใจ และวิธีการจําลองร่วมกันอื่นๆ สามารถนํามาใช้สําหรับการผสานข้อมูลหลายโหมดเพื่อปรับปรุงความแม่นยําของการจําแนกความหมาย ในการประยุกต์ใช้จริง การเลือกวิธีการผสานที่เหมาะสม และการปรับแต่งและหาประสิทธิภาพของวิธีการตามลักษณะของข้อมูลและงานที่แตกต่างกัน จะช่วยเพิ่มประสิทธิภาพของการจําแนกความหมายและให้โอกาสการพัฒนาและประยุกต์ใช้งานการจําแนกความหมายได้มากขึ้น
WiMi ใช้การประมวลผลข้อมูลก่อนการวิเคราะห์ลักษณะการสกัดข้อมูล การผสานข้อมูล และการฝึกระบบจําแนกความหมายเพื่อบรรลุการจําแนกความหมายสําหรับการผสานข้อมูลหลายโหมด ก่อนอื่นข้อมูลที่ได้จากเซนเซอร์ต่างๆ จําเป็นต้องผ่านการประมวลผลก่อน เช่น การปรับปรุงคุณภาพข้อมูล แก้ไขสัญญาณรบกวน และการปรับปรุงคุณภาพข้อมูล เพื่อเพิ่มประสิทธิภาพและความใช้งานได้ของข้อมูล ต่อจากนั้นลักษณะจะถูกสกัดจากข้อมูลของแต่ละเซนเซอร์ สําหรับข้อมูลภาพ เครือข่ายประสาทเทียมสามารถใช้สกัดการแทนความหมายของภาพได้ สําหรับข้อมูลข้อความ ระบบการแทนความหมายของคําสามารถใช้แปลงข้อความเป็นเวกเตอร์ได้ จากนั้นบนพื้นฐานการสกัดลักษณะ ลักษณะจากข้อมูลเซนเซอร์ต่างๆ จะถูกผสานรวมกัน สุดท้ายลักษณะที่ผสานแล้วจะถูกใช้ในการฝึกระบบจําแนกความหมาย
การจําแนกความหมายสําหรับการผสานข้อมูลหลา