כל התוכן הפתוח של מאגר העיתונות אונדקס במערכת!

נגיש לחיפוש ב-

http://opa.org.il

וב-API לחיפוש באמצעות URL למשל כך:
http://opa.org.il/api/v1/?query=יהודה

תודה רבה ליניב ולאסף התותחים, וגם לאורי ואשד שעזרו לדבר הזה לקרות.
לא פחות מזה, גם לנועם שבלעדיו אולי (אולי) היינו עושים את זה, אבל היה לנו הרבה יותר משעמם…

לקח חודש יותר ממה שהערכנו (בעיקר בגלל בעיות טכניות), אבל להערכתי יש כ-750,000 דפי עיתון שמחכים לנו לעשות איתם דברים נפלאים :slight_smile:

עידו

2 לייקים

כל הכבוד!

שתי שאלות:

  1. יש תיעוד ל REST API?

  2. כרגע נראה שהחיפוש עובד על OR, כלומר אם מחפשים מונח של יותר ממלה אחרת יופיעו תוצאות שיש בהן לפחות אחת מהמלים. איך גורמים לו לעבוד ב AND, שיופיעו רק תוצאות שמכילות את כל המלים? (אולי כדאי לשקול לעשות את זה לברירת המחדל, מכיון שזו הדרך שגוגל עובד אני מניח שזה מה שרוב המשתמשים מצפים לו)

לייק 1

נהדר!

נראה טוב ועובד מהר (ויחסית מוצא דברים רלוונטיים…)

תודה :)חשוב/חשבי מה יהיה כשנשפר את ה-ranking והתצוגה…

שאלו אותי מה ההבדל בין החשמביר לבין http://web.nli.org.il/sites/JPress/Hebrew/Pages/default.aspx

תודה,
אלון

נהדר ומאוד שימושי. כל הכבוד לעוסקים במלאכה.
הערת שיפור - כדאי להוסיף בדף הנחיתה באתר על איזה עיתונים + שנים מדובר, כך זה יאפשר לאנשים מבחוץ להשתמש בתוכנה יותר.
קרין

כרגע ההבדל הוא שאנחנו יוצרים לאותו האוסף API שמאפשר שימוש בתוצאות החיפושים לאינסוף יישומים אפשריים ומאפשרים אינדוקס על ידי מנועי חיפוש (כך שגם אלו שלא מכירים את האתר ששלחת יופנו לתוצאות מתוכו). בהמשך, אנחנו מקווים, נוכל להוסיף גם מנגנון תיקוני OCR, שיאפשר גם שיפור החיפוש והשימושים האחרים.

נשמע מגניב, אך כשניסיתי מוחזרת לי שגיאה מס’ 500 לכל חיפוש שאני מנסה לעשות…
מה אפשר לעשות?

לייק 1