שלום לכולם,
כדי לעדכן באתר כל-זכות תכנים שמקורם במשרד הרווחה, אנחנו צריכים להיות מסוגלים להעתיק תוכן מתוך הוראות התע"ס. ההוראות מפורסמות בפורמט PDF, אבל אנחנו לא יודעים לפענח את הקידוד שלהן; בהעתקה מתקבלים טקסטים כגון “➎➀❼10➂☎❹❺☎❸9➌❹❸”. דוגמה לקובץ כזה באתר משרד הרווחה.
חילצתי חלק מהמידע באמצעות OCR (השתמשתי ב-Google Docs לצורך זה), אך מדובר בתהליך מסורבל ואני מנסה להקל על העורכים אצלנו. למישהו יש מושג איך לטפל בקידוד הזה?
תודה,
דרור