עבור לתוכן הראשי

חדשות

חוקרים במעבדת המחקר של יבמ בחיפה

חוקרים במעבדת המחקר של יבמ בחיפה בשיתוף עם מספר גופים מאירופה פיתחו מנוע חיפוש אנליטי המאפשר לזהות אנשים, מקומות וחפצים תוך שימוש בתמונה או בקטע וידיאו שנשלח בתור שאילתא למערכת.

הטכנולוגיה החדשה תאפשר, למשל, לזהות ולאתר חלקי חילוף או קטעי תמונת נוף באותה קלות שבה ניתן להעלות תמונה דיגיטאלית אל המחשב האישי, לזהות קטע מוסיקה או שיר באמצעות זמזום פזמון אל המיקרופון במחשב – וליהנות מהיכולות האלה גם במגוון רחב של יישומים עסקיים חדשים שיישענו על היכולות האלה.

הפיתוח נעשה במסגרת קונסורציום כלל-אירופי הפועל במימון תוכנית המסגרת של הקהילה האירופית.

פרויקט SAPIR – ראשי תיבות אנגליים של "חיפוש בתכנים אודיו-ויזואליים תוך שימוש בשליפת מידע מפיר לפיר", מאפשר לנתח את הפיקסלים הבודדים בתכנים אודיו-ויזואליים בקבצים ומאגרים גדולים במיוחד. כך, למשל, יכולה המערכת לנתח תמונה דיגיטאלית או קובץ מוסיקה – גם כאשר התכנים האלה לא מופתחו מראש, ולא הוגדרו להם תגיות או אינדקסים המתארים את התוכן בכל קובץ. תכני המולטימדיה מאונדקסים באופן אוטומטי, על מנת לאפשר שליפה מהירה שלהם בעתיד.

יוסי מס, חוקר במעבדת המחקר של יבמ בחיפה, ציין כי "ספיר צופן פוטנציאל של שינוי מוחלט בחוקי המשחק של מידרוג החיפוש, הטיפול והניתוח בתכנים מסוגים שונים. המערכת מתמודדת עם הבעייה שהייתה מוכרת היטב – בפרספקטיבה שונה לחלוטין, ופותחת עולם שלם של אפשרויות חדשות לשימוש במולטימידה לצורך ניתוח של תכנים בעולם האודיו-ויזואלי שבו אנו חיים".

מערכת ספיר יודעת לבצע מיפתוח אוטומטי ומאפשרת לעבור ולדפדף במאגרים של מיליוני פריטי מולטימדיה, באמצעות הפקה של "תיאורים ברמה בסיסית", אותם גוזרת המערכת מתמונות או מקטעי וידיאו – על בסיס צבעים, מבנה, פריסה, צורות או צלילים.

תייר המשתמש, למשל, במצלמת הטלפון הנייד שלו על מנת להנציח תמונה של אנדרטה, יוכל להיעזר ב"ספיר" על מנת להשוות את התמונה עם תצלומים אחרים של אותו אתר הזמינים – למשל – באינטרנט, ולשלוף משם מידע נוסף. מחקר עתידי ופיתוח נוסף של הטכנולוגיה, יאפשרו לנתח פריטים ומשתנים ברמת דיוק גבוהה במיוחד. כך, אפשר יהיה למשל לצלם תיק אופנתי אותו נושאת אישה ברחוב – ולאתר מיידית אלו חנויות באיזור מציעות למכירה תיק דומה. בעתיד, עשויים מדענים להמשיך ולהרחיב את טווח המידרוג של "ספיר", בדרך לסיוע לרופאים לנתח באופן מיידי תמונות הדמיה רפואית ותכני מדיה עשירים הזמינים בתיק הרפואי של החולה – ולקבל חיווי אודות אבחנה רפואית אפשרית של מחלתו. זאת, באמצעות השוואת תוצאות של נתונים היסטוריים הזמינים במאגרים רפואיים מבוזרים, ומתייחסים לאוכלוסיות חולים גדולות – אל נתוני החולה הבודד.

תכני מולטימדיה מהווים כיום את החלק הגדול ביותר של המידע המאוחסן וזמין באמצעות האינטרנט. על פי דו"ח של חברת הייעוץ IDC ממאי השנה, 95% מהמידע האלקטרוני הזמין באינטרנט, דוגמת תמונות דיגיטאליות, אינו מובנה – ולפיכך גם אינו מנוהל במסגרת קטגריות, או מתוייג. תמונות המצולמות באמצעות יותר ממליארד מכשירים ברחבי העולם, מהווים את החלק הגדול ביותר של העולם הדיגיטאלי. מספר התמונות שצולמו באמצעות טלפונים סלולאריים עמד בשנת 2006 על 100 מיליארד – והוא צפוי להגיע ל- 500 מיליארד עד 1020.

מערכת ספיר נוברת במאגר העצום והצומח במהירות של תכני מולטימדיה בלתי ממופתחים, ומציעה אמינות גבוהה במיוחד וכושר טיפול בקיבולת כמעט אין-סופית. המערכת משתמשת בטכנולוגיית של ארגון אוטומטי של תוכן במבנה פיר לפיר המבטיחה שאין למערכת נקודת כשל בודדת, והמאפשרת להוסיף חומרה לשרת, ולהגדיל את קיבולת האחסון והתוכן המנוהל ככל שאוסף החומר ממשיך לגדול. העדכון וה"טריות" של המפתחות מובטחים בזכות הגישה לפיה ספקי תוכן דוחפים באופן אוטומטי את החומרים שלהם אל תוך המאגר הניתן לחיפוש.

ניתן לנסות את המערכת על מאגר של 100 מיליון תמונות ומספר שעות של וידיאו באתר http://sapir.isti.cnr.it.