ציטוט:
נכתב במקור על ידי בניה
היתרון המשמעותי בקאפצה בעברית שלאף אחד לא ישתלם מספיק כדי לכתוב OCR חזק מספיק כדי לפרוץ אותה.
|
אני אשמח אם תסביר לי על איזה מימוש של OCR אתה דיברת כי ככל הנראה אני לא מכיר אותו. ממה שאני מכיר יש ניתוח של התווים בתמונה ולפי הלימוד של המערכת היא יודעת לשייך אותם. אם תלמד מערכת כמו tesseract על טקסטים בעברית היא אמורה לעבוד. וגם מחיפוש מהיר בגוגל עולה שיש כבר מערכות OCR שנבדקו על עברית -
http://code.google.com/p/qhocr.
נ.ב
עד כמה שידוע לי הדברים האלה בדרך כלל יוצאים מהאקדמיה והאקרים וספאמרים למיניהם משתמשים בהם ולא ההפך.. הייתי שמח לשמוע על מקרה הפוך
עריכה:
סתם בשביל מי שרוצה להיכנס יותר לתחום אני מציע להסתכל על lenet מבית AT&T labs. זאת תוכנה שממשת OCR בעזרת רשתות נוירונים. התוצאות שלה די מרשימות ואין לי ספק שעם מאגר הלימוד המתאים היא תדע להתמודד עם עברית.
http://yann.lecun.com/exdb/lenet/