ציטוט:
נכתב במקור על ידי shuval
וואלה? ספר את זה לYAAW, יש להם 300 קישורים מעמודים עם 10 אלף קישורים יוצאים. הם מקום ראשון רק בזכות התוכן. הם עקפו אתרים שנבנו עם קישורים מאוד איכותיים מאתרים כמו YAD2 וMASTERJOB וכן הלאה...
|
אני לא מבין מה אתה מציג כאן כדוגמא. מאיפה הסקת שיש להם רק 300 קישורים? ושהם עמוד ראשון רק בזכות התוכן?
אני מזמין אותך לערוך ניסוי - נסה לקדם אתר בביטוי שבכלל לא מופיע באתר. בעבר זה נחשב משהו כמעט "בלתי אפשרי" מבחינת משאבים. היום? כבר קצת פחות קשה.
לא אמרתי שזה רק רק רק קישורים - רק שהחשיבות שלהם גדולה יותר. מן הסתם שאם מופיע המילה הרלוונטית בתוכן, ויש תוכן
אמיתי אז זה עוזר, אבל הטענה המרכזית היא שגם אם התוכן "חרא" לא תהיה לך בעייה להיות במקום הראשון.
התחיל כאן שביב של דיון בנוגע לאיכות של תוכן.
גוגל - לצערו הרב - לא חושב כמו בן אדם. כמו כל תוכנת מחשב, הוא מנסה למצוא חוקיות כלשהי.
אם תכתוב "יוסי חתול כלב אוכל טעים הלכתי גינה", גוגל יודע לזהות בקלות שזה ספאם - יש כאן מבנה לא הגיוני.
אם תכתוב לעומת זאת "יוסי מורח גינה על פרוסת כלב" - זה כבר נשמע לו הגיוני. לפחות מבחינת התחביר.
גוגל גם יודע לזהות זכר נקבה וריבוי - זאת אומרת, "הלכתי פעם אל החתול המכוערת" או "החתול המכוערים", וכו' - יגרום לו "לחשוד", שוב פעם.
לעומת זאת, "היום אכלתי גינה. ואז שמעתי אוזן" - יהיה לו הרבה יותר קשה לזהות שיש כאן משהו לא בסדר - הרי, מבחינה תחבירית "דיבורית" הכל בסדר. ("היום אכלתי תפוח" / "ואז שמעתי כלב").
אז עד עכשיו דיברנו על מנגנון אחד - בדיקת כללים תחביריים נטו.
הדבר השני - זה רלוונטיות וצירופי-מקצוע. מה זאת אומרת? לי יש אתר על מדעי המחשב שמדבר על אלגוריתם SIMPLEX. לחבר שלי יש אתר על מדעי המחשב שמדבר על אלגוריתם האליפסואיד.
אם לך יש אתר על מדעי המחשב שמדבר גם על SIMPLEX וגם על אלגוריתם האליפסואיד - אז כנראה שהאתר שלך מאוד רלוונטי.
(כמובן - בהקצנה. צריך יותר מאתר אחד שידבר על כל אחד מהם).
ומהכיוון ההפוך - אם כל האתרים שבנושא מדעי המחשב מדברים על תכנות, והאתר שלך בכלל לא "מדבר" על זה, אז כנראה - שמה לעשות - האתר שלך יהיה פחות רלוונטי בעיני גוגל.
הדבר השלישי - ראשוניות. בניגוד לדעה ה(מעט) רווחת שהעתקת מאמרים פוגעת בכל הצדדים, זה לא כל כך נכון. אם אני כותב מאמר, מפרסם אותו באתר שלי, וכעבור שבוע המון המון המון אתרים יצטטו אותו - אפילו בלי לקשר - סימן שהאתר שלי מאוד רלוונטי ומכיל מידע חשוב.
אם "טבעתי" מושג חדש והתחילו לצטט אותו,
אם כתוצאה ממשהו שפרסמתי נוצר קונצנזוס יחסית גדול ז"א - אם ברגע ש-Wikileaks מפיצים מסמכים על פרשת ווטרגייט, פרשה שכבר "נשכחה" מבחינת כמויות החיפוש, וגוגל מצליח לזהות שהם ה"מקור" - הרי שזה אומר שהם אתר מאוד רלוונטי.
יש עוד פרמטרים כמובן (וכמות עצומה של מאמרים בנושא), אבל אני חושב שאלה הם ה-3 שהכי פחות מתייחסים אליהם ביחס לחשיבות העצומה שלהם.
מה לעשות, שאם אתם מעתיקים מאמר באנגלית, מתרגמים אותו לכמה שפות וחזרה לעברית ו"כאילו" יוצא לכם ערבול טקסט - אז זאת טעות דיי גדולה. גוגל משתמשת בכל הטכנולוגיות שלה כשצריך. לפני שהיה את הזיהוי המעולה של גוגל בנוגע לצירופי סמיכות למיניהם ותארים של זכר/נקבה/יחיד/רבים, מה שמיד לאחר שהוקם השינוי הזה קרה - הוא, Google Translate.
גוגל היא מי שמספקת ומפתחת את השירות - לזהות אם העתקתם מאמר זה הדבר הכי פחות בעייתי בשבילה (בעיקר בהתחשב בעובדה שכל מאמר אתם
מתרגמים על ידה).
תזכרו שתרגום זה באין מונים יותר קשה מבדיקת תקינות. אם הם ברמה כזאת של תרגום, אפשר להניח הנחות שהם כבר יזהו משפטים כגון "אני קלף גינה תפוח", ואפילו, "אני הולך גינה".