Robots באתר הכנסת

זה הופיע לי בפיד - מישהו הסתכל פעם על robots.txt באתר כנסת ישראל?

http://knesset.gov.il/robots.txt

פשוט הזוי.

@OriHoch @ofri @daonb

(להדיוטות: זה הקובץ שאומר למנועי חיפוש איזה קבצים מותר להם להכניס לאינדקס - נראה שהם ממש לא רוצים שקבצים מסוימים יופיעו במנועי חיפוש…)

אדם

אה, וגם @morchickit

לצערי גיליתי את זה רק אחרי שכבר סיימתי לכתוב את הcrawler של ישיבות המליאה…

בקטע קצת מוזר וסוטה הרצתי בדיקה על כל אתרי ה-gov.il.
האתר היחיד שיש לו קובץ robots הוא האתר של רשות שדות התעופה, והקובץ שלהם דיפולטיבי.
בקיצור, האתר של הכנסת מוזר.