Skip to main content
|

שחזור טקסטים קדומים בכלים חישוביים

מדרש אבוד מהמאה השלישית נשלף מתוך טקסט בן המאה ה-13 באמצעות אלגוריתם

Image
שחזור כתבים

מדרש אבוד מהמאה השלישית שוחזר מתוך טקסט מהמאה ה-13 באמצעות כלים חישוביים מהמאה ה-21, במחקר משותף של אוניברסיטת בן-גוריון ואוניברסיטת בר-אילן. 

פרופ' מיכל בר-אשר סיגל, חוקרת תלמוד מהמחלקה למחשבת ישראל באוניברסיטת בן-גוריון בנגב, ביקשה לאתר מדרש אבוד על ספר דברים שנכתב במאה השלישית, ולשם כך שיתפה פעולה עם ד"ר אבי שמידמן מהמחלקה לספרות עם ישראל באוניברסיטת בר-אילן. באמצעות שימוש בכלי חישוב מתקדמים, שחזרו השניים את המדרש האבוד והחזירו אותו לארון הספרים היהודי.  

חכמי המדרש חיו במאות הראשונות לספירה וכתבו פירושים לחומשי התורה, שנערכו במאה השלישית לספירה. אחד מהמדרשים הידועים, שנקרא "מכילתא (בארמית 'מידה') דברים" אבד במשך הדורות, ואיתו אבדו תפיסות עולם ותובנות תאולוגיות של הפרשנים הקדומים. חכם בשם ר' דוד בן עמרם עדני, שחי בעדן שבתימן במאה ה-13, ציטט ממדרש "מכילתא" קטעים רבים בחיבורו הנודע "המדרש הגדול". אך ר' עדני שילב בציטוטים קטעים מספרים אחרים, שינה את סדר המילים ועוד, ובכך שינה ועיבד את הטקסט המקורי. כדי להשיג גישה לטקסט המקורי בן המאה השלישית נדרשים כלים חישוביים. 

"לצורך מחקר זה, השתמשנו בשיטה חישובית חדשה ופורצת דרך, שיטה של אילומינציה: להריץ מול הטקסט המעובד את כל הטקסטים האחרים מספרות היהודית ולנפות את המקבילות שאינן המדרש הקדום. לא רצינו לחפש משהו ספציפי, אלא לחפש 'הכול מול הכול' - להריץ כל פסקה בטקסט האחד מול כל הפסקאות שבקורפוס האחר," מסביר ד"ר שמידמן. "בעצם, במקום להגיד למחשב מה לחפש, אנחנו נותנים למחשב למצוא את המקבילות בעצמו." 

מחקרם של בר-אשר סיגל ושמידמן עסק בזיקוק מדרש "מכילתא" מהשינויים המאוחרים שערך ר' עדני וכך שיחזרו את הטקסט האבוד. כלים חישוביים ואלגוריתמים שפותחו על ידי ד"ר שמידמן במיוחד למטרה זו, בשיתוף מרכז DICTA לניתוח טקסטים, שימשו לשחזור הטקסט המקורי. 

הפיתוח החדשני של אלגוריתם הוא שאפשר את המחקר. ההפרדה בין הטקסטים נעשתה על בסיס התאמה חלקית בין הטקסט למקורות. "הרי המקורות המצוטטים אינם מובאים בציטוטים מדויקים, אלא בשינוי סדר המילים, בהוספת אותיות שימוש, בשינויים באיות המילים, בדילוגים ובהשמטות, בהחלפת מילים בשמות נרדפים, ועוד כיוצא בכך," מסביר ד"ר שמידמן. "כדי לאתר מקבילות, האלגוריתם החדש מתבסס על שיטה שנקראת 'התאמות עמומות'. כך בוחן המחשב כל רצף של מילים ב'מדרש הגדול' מול כל רצפי מילים שבקורפוס, ומזהה מקבילות למרות שהן חלקיות או שונות." 

בעזרת האלגוריתם החוקרים סרקו את הטקסט מהמאה ה-13, שלפו מתוכו את כל חלקי המדרש הקדום ואיתרו שינויים שנעשו בו. בשלב הבא, הם בדקו את הימצאותם של קטעי רמב"ם מחודשים, גמרא ומדרשים אחרים ששולבו גם הם בתוך הטקסט שחובר על ידי עדני. עם זאת, עדיין מדובר בתוצאות של חישוב אוטומטי. בהתייחס לכך ציין ד"ר שמידמן שהחוקרים אינם סומכים על המחשב בעיניים עצומות, וכל תוצאה שהופקה על ידי האלגוריתם נבחנה על ידי צוות המחקר. "המחשב נותן לנו תוצאות רחבות המצביעות על כל מקבילה אפשרית, וזה מה שמאפשר לנו להספיק לטפל בטקסט כה ארוך ולהשוות אותו לקורפוס כה רחב. אבל בסופו של דבר העין האנושית מחליטה בסופו של דבר עד כמה הצליח המחשב בכל משימה." 

 "תוצאות המחקר מעוררות התרגשות רבה בקרב חוקרי היהדות," ציינה פרופ' בר-אשר סיגל. "ללא השימוש באמצעים טכנולוגיים של המאה ה-21, ספק אם היינו מצליחים להחיות את המדרש אבוד". 

 לשאלה כיצד הפרויקט הנוכחי עשוי לקדם את מחקר התלמוד מצד אחד ואת השימוש בכלים חישוביים לחקר כתבים מצד שני, השיב ד"ר שמידמן, שלגבי מחקר התלמוד המהדורה החדשה תעניק טקסט אמין חדש לחוקרים הלומדים את ראשית תקופת חז"ל. לגבי שיטות החישוביות, שיטת החיפוש "הכול מול הכול" עשויה להאיר את פני המחקר בכל פרויקט שעוסק ביחס שבין שני טקסטים או בין שני קורפוסים של טקסטים. 

ואכן, צפויים מחקרי המשך. "חיבורים אבודים שאפשר לדלל מליקוטים מאוחרים קיימים גם לגבי מדרשים אחרים על ספרי מקרא אחרים, וגם לגבי ז'אנרים אחרים לגמרי, ועל בסיס הצלחת פרויקט זה נתקדם ונרחיב את שדה מחקרנו," מבטיח ד"ר שמידמן. 

כתבה: שחר שלוח