הוסטס - פורום אחסון האתרים הגדול בישראל

הוסטס - פורום אחסון האתרים הגדול בישראל (https://hosts.co.il/forums/index.php)
-   פורום תיכנות (https://hosts.co.il/forums/forumdisplay.php?f=14)
-   -   פרסום | קאפטצ'ה בסגנון וואלה! (https://hosts.co.il/forums/showthread.php?t=91587)

Haimz 20-08-11 13:41

בשביל לצבוע אות אות, אני צריך לחלק את המילה ולהגידר לך POSITION אחר בכל פעם ?
ואני יעבוד עליה עוד קצת, דרך אגב זה לא מוצר או בדומה לזה, זה סה"כ משהו שבניתי משעמום

בניה 20-08-11 13:53

היתרון המשמעותי בקאפצה בעברית שלאף אחד לא ישתלם מספיק כדי לכתוב OCR חזק מספיק כדי לפרוץ אותה.

אנשים כותבים בוטים שפורצים OCR כדי ליצור חשבונות מייל לשליחת SPAM או דרך טפסי צור קשר.
כדי לשתול לינקים באתרים ופורומים כדי לעזור לSEO וכדי ליצור טראפיק כל זה שווה להם המון המון כסף אז משתלם להם לכתוב OCR חזק.
השוק הישראלי פיצפון אז לאף אחד לא ישתלם לכתוב OCR חזק בשביל להרוויח עוד כמה אתרים מסכנים...

Kfir.G 20-08-11 16:06

ציטוט:

נכתב במקור על ידי בניה (פרסם 815588)
היתרון המשמעותי בקאפצה בעברית שלאף אחד לא ישתלם מספיק כדי לכתוב OCR חזק מספיק כדי לפרוץ אותה.

אני אשמח אם תסביר לי על איזה מימוש של OCR אתה דיברת כי ככל הנראה אני לא מכיר אותו. ממה שאני מכיר יש ניתוח של התווים בתמונה ולפי הלימוד של המערכת היא יודעת לשייך אותם. אם תלמד מערכת כמו tesseract על טקסטים בעברית היא אמורה לעבוד. וגם מחיפוש מהיר בגוגל עולה שיש כבר מערכות OCR שנבדקו על עברית - http://code.google.com/p/qhocr.

נ.ב
עד כמה שידוע לי הדברים האלה בדרך כלל יוצאים מהאקדמיה והאקרים וספאמרים למיניהם משתמשים בהם ולא ההפך.. הייתי שמח לשמוע על מקרה הפוך :)

עריכה:
סתם בשביל מי שרוצה להיכנס יותר לתחום אני מציע להסתכל על lenet מבית AT&T labs. זאת תוכנה שממשת OCR בעזרת רשתות נוירונים. התוצאות שלה די מרשימות ואין לי ספק שעם מאגר הלימוד המתאים היא תדע להתמודד עם עברית.
http://yann.lecun.com/exdb/lenet/


כל הזמנים הם GMT +2. הזמן כעת הוא 10:36.

מופעל באמצעות VBulletin גרסה 3.8.6
כל הזכויות שמורות ©
כל הזכויות שמורות לסולל יבוא ורשתות (1997) בע"מ