בקרוב: אתרים יוכלו להקריא תוכן ולקבל פקודות קוליות?
13/09/2010
 
 

בעקבות פעילות חדשה של ארגון התקינה W3C, ייתכן שבקרוב הגולשים לא רק יקראו את המידע שמופיע בעמודי הרשת, אלא גם ינהלו עמם שיחות.

קבוצה חדשה בארגון בוחנת את האפשרות של הוספת ממשקי זיהוי קול והפקת דיבור לעמודי רשת.

קבוצה זו צפויה להגיש בעוד כשנה דוח שיסכם את אפשרויות הביצוע של הוספת תכונות קוליות ל-HTML, הסטנדרט של הארגון לעמודי רשת. מהנדסים של AT&T, גוגל, מיקרוסופט ומוזילה הם בין השותפים ליוזמה.

הקול האנושי ורשת האינטרנט אינם זרים זה לזה: גוגל הוסיפה אפליקציית חיפוש מבוססת קול לאנדרואיד, ומיקרוסופט מבטיחה לכלול פקודות קוליות במערכת ה-Windows Phone 7.

צוות ה-HTML Speech Incubator Group יבחן פיתוח של ממשק משתמש סטנדרטי לזיהוי קול כמו גם להפקת דיבור, אמר יו"ר הקבוצה דן ברנט, המשמש גם כמנהל טכנולוגיות הדיבור בחברת Voxeo, ספקית של מערכות תגובה קולית.

ממשק שכזה יוכל לשמש דפדפנים רבים: בעודם משתמשים בתכונות הללו שיהיו מובנות בתוכם או יתווספו להם באמצעות פלאג-אין, יוכלו הדפדפנים להקריא את תכני העמודים או לאפשר למשתמשים למלא טפסים ברשת על-ידי פקודות קוליות.

אף שהעבודה על הסטנדרט החדש עשויה לחפוף לפיתוח אחר של ממשק מבוסס קול שעליו שוקד הארגון, VoiceXML, לדברי ברנט ישנו שוני בין שתי היוזמות. העבודה שמקיים VoiceXML עם הרשת לא תהיה מיטבית, בהתחשב בכך שהוא תוכנן בעיקר עבור יישומים מבוססי קול.

ארגון ה-W3C עסק בפיתוח טכנולוגיות דיבור עבור מספר מיזמים נוספים, וכן שחרר באחרונה את VoiceXML בגרסה 3.0. הארגון מתכנן לשחרר בקרוב גם את גרסה 1.1 של SSML - שפת התגיות עבור הפקת דיבור, שלעתים קרובות נעשה בה שימוש לצד VoiceXML.

הגרסה החדשה של SSML תכלול שפות אסייתיות ותספק למפתחים גמישות רבה יותר בבחירת הקול ובהתמודדות עם תוכן שמקורו בשפות לא נפוצות.

הדפסהוסף תגובה
עבור לתוכן העמוד