טכנולוגיית הבינה המלאכותית מובילה לייצוג טבעי יותר של הצלילים, משפרת את יכולת הבנת הדיבור, מפחיתה את המאמץ השמיעתי, ומאפשרת להבין ואפילו לזכור יותר מהמידע שנאמר, גם בסביבות רועשות.
מהי בינה מלאכותית?
בינה מלאכותית (Aartificial Iintelligence- AI) הטמעת האינטליגנציה האנושית במכונות – מערכות הבינה המלאכותית מנסות לדמות את יכולות האינטלקט האנושי באמצעים טכנולוגיים.
למידת מכונה (Machine Learning- ML) – תת תחום של הבינה המלאכותית, במסגרתו פותחו מערכות המסוגלות ללמוד מנתונים, לקבל החלטות, ולשפר את ביצועיהן עם הניסיון.
במסגרת תהליך הלימוד, חושפים את המערכת למספר רב של גירויים באופן חזרתי. המערכת מנתחת אותם ומתחילה לזהות בהם דפוסים, תהליך המזכיר את אופן הלמידה האנושי.
רשתות עצביות עמוקות (Deep neural networks – DNN) – סוג מתקדם של למידת מכונה, המשתמש ברשתות עצביות מלאכותיות בעלות רבדים רבים (ולכן “עמוקות”), לצורך ניתוח נתונים. ההשראה לכך הם המבנה והתפקוד של המוח האנושי, ובמיוחד הקשרים בין הנוירונים במוח.
מערכות ה-DNN לומדות מתוך התנסויות בסביבה הטבעית של בני האדם (בניגוד ללמידה בתנאי מעבדה).
טכנולוגיית ה-DNN מיושמת לצרכים שונים, כגון תרגום שפות, סיוע באבחנות רפואיות, ולענייננו – במכשירי שמיעה.
יישום טכנולוגיית הבינה המלאכותית במכשירי השמיעה של Oticon
במכשירי השמיעה של Oticon קיימת מערכת DNN מובנית, אשר עברה תהליך אימון אינטנסיבי באמצעות חשיפה חוזרת למיליוני צלילים מסביבתו הטבעית של האדם.
נמחיש את תהליך לימוד המערכת באמצעות הדוגמה הבאה:
- למערכת מושמע צליל של חצוצרה.
- הצליל מועבר דרך שכבות ה-DNN, ומנותח לצורך זיהוי מאפייניו היחודיים (אם מדובר בצליל בתדר גבוה או נמוך, למשל).
- המערכת מחליטה אם מדובר בצליל של חצוצרה, או בצליל מסוג אחר.
- מתקבל פידבק חיובי או שלילי בהתאם להחלטה שהתקבלה, על מנת להביא ללמידה ולשיפור המערכת.
- התהליך חוזר על עצמו שוב ושוב, עד שהמערכת לומדת לזהות את צליל החצוצרה באופן מיידי.
באופן זה, נחשפה מערכת ה-DNN במכשירי השמיעה למגוון סיטואציות שמיעתיות יומיומיות – בילוי במסעדה רועשת, ביקור ברחוב סואן, נסיעה ברכבת ועוד. באמצעות תהליך זה נלמדו מאפייניהם מדויקים של מיליוני צלילים. לאחר האימון הרב שעברה, המערכת מצליחה לנתח, לאזן ולתעדף את המידע השמיעתי הנקלט במכשיר השמיעה.
כיוון שהלימוד נעשה באופן חווייתי, ואינו נסמך על כללי מעבדה מוגבלים, צלילי הדיבור מעובדים בצורה טבעית יותר, המדמה את תהליך עיבוד הצליל במוח האנושי.
יתרונות הבינה המלאכותית במכשירי שמיעה
דמיינו את הסיטואציה הבאה: אתם נמצאים במסעדה. האדם שנמצא מולכם מדבר, בעודכם קמים על מנת לעזוב את המקום. מאחוריכם נמצא מלצר, אשר מחזיק בידו מגש עמוס.
בסיטואציה כזו, שימוש במכשיר שמיעה מסורתי יהווה חיסרון. מדוע?
מכשיר שמיעה מסורתי מתמקד בדיבור המגיע מלפנים, ומחליש משמעותית את שאר צלילי הסביבה. כלומר, במקרה זה, סביר להניח שלא הייתם שומעים את המלצר עם המגש העמוס מאחוריכם.
מכשיר שמיעה אשר משלב מערכת DNN מובנית, לעומת זאת, מאפשר למוח לקבל גישה לסצנה השמיעתית המלאה, כך שתוכלו לשמוע את האדם שלידכם, את שקשוק הסכו”ם על הצלחת, וגם את המלצר מאחוריכם.
מערכת ה-DNN למדה להבחין בין הצלילים החשובים למשתמש (כדוגמת צלילי דיבור), ובין הצלילים הפחות חשובים לו (רעש לסוגיו). בהתאם להבחנה זו, צלילים משמעותיים יותר מודגשים בחזית, וצלילים משמעותיים פחות נותרים ברקע.
התוצאה היא ניגוד עדין בין צלילים משמעותיים לרעשי רקע, כך שהמידע השמיעתי כולו מועבר בצורה מאוזנת ונאמנה יותר לצליל המקורי. זאת, כאמור, לעומת עיבוד הצליל הגס יותר, המבוצע על ידי מנגנוני הפחתת הרעש המסורתיים.
בסופו של דבר, טכנולוגיית הבינה המלאכותית מובילה לייצוג טבעי יותר של הצלילים, משפרת את יכולת הבנת הדיבור, מפחיתה את המאמץ השמיעתי, ומאפשרת להבין ואפילו לזכור יותר מהמידע שנאמר, גם בסביבות רועשות.
המערכת החדשה והמשודרגת – DNN 2.0
™Oticon MORE, אשר הושק בשנת 2022, היה מכשיר השמיעה הראשון בעולם בו שולבה בו טכנולוגיית בינה מלאכותית.
בדגם החדש, ™Oticon Intent, אשר הושק ממש לאחרונה (2024), עברה מערכת ה-DNN תהליך שדרוג משמעותי.
שדרוג זה הניב שני שיפורים חשובים:
באמצעות חשיפה למיליוני צלילים נוספים, למדה המערכת לזהות ולקטלג צלילים רבים עוד יותר, כך שמצליחה כעת להתמודד באופן אופטימלי עם מגוון רב יותר של קולות ושל רעשי סביבה.
עיבוד צליל מוקפד ובעל ניואנסים דקים עוד יותר, בזכות הגדלת מספר ערוצי עיבוד הצליל ל-256, בהשוואה ל-24 ערוצים בגרסת ה-DNN הקודמת.
השיפורים הללו תורמים להפחתת המאמץ השמיעתי, ומובילים לחווית שמיעה מלאה, מאוזנת וטבעית.