اخیراً در شبکهی اجتماعی لینکدین، پستی منتشر شده است که در آن به این موضوع پرداخته شده که آیا دادههای ساختاریافتهی Schema.org بر خروجی مدلهای زبانی بزرگ (LLM) تأثیر میگذارند یا خیر. به نظر میرسد برخی از متخصصان سئو در حال توصیهی استفاده از دادههای ساختاریافته برای بهبود رتبهبندی در موتورهای جستجوی هوش مصنوعی هستند.
پاتریک استوکس در پستی در لینکدین نوشته است:
“آیا من چیزی را از دست دادهام؟ چرا متخصصان سئو فکر میکنند که نشانهگذاری Schema بر خروجی مدلهای زبانی بزرگ تأثیر میگذارد؟”
به نظر میرسد منظور او از “خروجی مدلهای زبانی بزرگ” به موتورهای جستجوی هوش مصنوعی مانند ChatGPT Search اشاره دارد. اما آیا موتورهای جستجوی هوش مصنوعی دادههای خود را از طریق دادههای ساختاریافته دریافت میکنند؟
مدلهای زبانی بزرگ (LLM) بر اساس متنهای وب، کتابها، اسناد دولتی، مدارک حقوقی و سایر دادههای متنی (و همچنین سایر فرمهای رسانهای) آموزش داده میشوند. این دادهها برای تولید خلاصهها و پاسخها استفاده میشوند، اما بدون کپیبرداری مستقیم از دادههای آموزشی. بنابراین، این تصور که بهینهسازی محتوای وب میتواند منجر به ارجاع مستقیم مدلهای زبانی بزرگ به یک وبسایت شود، بیمعنی است.
موتورهای جستجوی هوش مصنوعی بر اساس شاخصهای جستجو (و گرافهای دانش) از طریق روشی به نام تولید تقویتشده با بازیابی (RAG) عمل میکنند. شاخصهای موتورهای جستجو نیز از دادههای خزیدهشده ایجاد میشوند، نه از دادههای ساختاریافتهی Schema. به عنوان مثال، Perplexity AI از نسخهی اصلاحشدهی الگوریتم PageRank برای رتبهبندی محتوای خزیدهشده استفاده میکند. گوگل و بینگ نیز متنها را از HTML استخراج میکنند و کارهایی مانند حذف محتوای تکراری، حذف کلمات توقف و سایر پردازشها را انجام میدهند. علاوه بر این، همهی صفحات وب حاوی دادههای ساختاریافته نیستند.
در واقع، گوگل تنها از بخش کوچکی از دادههای ساختاریافتهی Schema.org برای تجربههای جستجوی خاص و نتایج غنی استفاده میکند، که این موضوع باعث محدود شدن نوع دادههای ساختاریافتهای میشود که ناشران از آن استفاده میکنند.
همچنین، هر دو موتور جستجوی گوگل و بینگ HTML را رندر میکنند، هدرها، فوترها و محتوای اصلی را شناسایی میکنند و متن را برای اهداف رتبهبندی استخراج میکنند. اگر قرار بود به دادههای ساختاریافتهی Schema تکیه کنند، چرا این کار را انجام میدادند؟
این ایده که استفاده از دادههای ساختاریافتهی Schema.org میتواند به رتبهبندی بهتر در موتورهای جستجوی هوش مصنوعی کمک کند، بر اساس واقعیتها نیست و بیشتر شبیه به حدس و گمان است. یا ممکن است نتیجهی یک “بازی تلفن” باشد، جایی که یک نفر چیزی میگوید و پس از گذراندن چندین نفر، به چیزی کاملاً متفاوت تبدیل میشود.
به عنوان مثال، جونو آلدرسون پیشنهاد داده است که دادههای ساختاریافته میتوانند به عنوان یک استاندارد برای کمک به موتورهای جستجوی هوش مصنوعی در درک بهتر وب مورد استفاده قرار گیرند. او نگفته بود که موتورهای جستجوی هوش مصنوعی در حال حاضر از این دادهها استفاده میکنند، بلکه فقط پیشنهاد کرده بود که ممکن است در آینده از آن استفاده کنند. اما به نظر میرسد این ایده پس از گذراندن چندین نفر، به یک نظریهی کامل تبدیل شده است.
متأسفانه، در جامعهی سئو ایدههای بیپایه و اساس زیادی وجود دارد. به عنوان مثال، اخیراً دیدهام که یک متخصص سئو در شبکههای اجتماعی ادعا کرده است که گوگل از آدرسهای IP برای پاسخ به جستجوهای “نزدیک من” استفاده نمیکند. برای آزمایش این ادعا، کافی است از یک VPN استفاده کنید، یک موقعیت جغرافیایی برای آدرس IP خود انتخاب کنید و یک جستجوی “نزدیک من” انجام دهید. خواهید دید که آدرس IP مورد استفاده توسط VPN بر نتایج جستجو تأثیر میگذارد.
گوگل حتی یک صفحهی پشتیبانی منتشر کرده است که در آن توضیح داده شده است که از آدرس IP برای شخصیسازی نتایج جستجو استفاده میکند. با این حال، برخی افراد به دلیل مطالعات همبستگی انجامشده توسط برخی متخصصان سئو، به این موضوع اعتقاد ندارند و حتی وقتی با مستندات رسمی مواجه میشوند، ادعا میکنند که “گوگل دروغ میگوید.”
آیا به چشمان خود اعتماد خواهید کرد؟
در نهایت، توصیهی استفاده از دادههای ساختاریافتهی Schema.org برای آموزش مدلهای زبانی بزرگ نیز منطقی به نظر نمیرسد، زیرا دادههای آموزشی در خروجی مدلهای زبانی بزرگ ذکر نمیشوند. همانطور که قبلاً اشاره شد، ناشران تنها از بخش کوچکی از دادههای ساختاریافتهی Schema.org استفاده میکنند، زیرا گوگل نیز تنها از بخش کوچکی از آن استفاده میکند. بنابراین، منطقی نیست که یک موتور جستجوی هوش مصنوعی برای خروجی خود به دادههای ساختاریافته تکیه کند.
کریستوفر شین، متخصص بازاریابی جستجو، در این باره نظر داده است:
“من هم پس از خواندن پست شما پاتریک، به همین نتیجه رسیدم. به نظر من، مدلهای زبانی بزرگ معمولاً پاسخهای خود را از صفحات نتایج موتورهای جستجو تولید نمیکنند، بلکه از تفسیر دادهها استفاده میکنند. درست است؟ اما دادههای ساختاریافتهی Schema توسط موتورهای جستجو برای نمایش نتایج غنی در صفحات نتایج استفاده میشوند. تفاوت کلیدی این است که موتورهای جستجو از Schema برای صفحات نتایج استفاده میکنند، در حالی که مدلهای زبانی بزرگ از تفسیر دادهها برای تأثیر Schema بر خروجی خود استفاده میکنند.”
افرادی مانند کریستوفر شین و پاتریک استوکس امیدوارکننده هستند، زیرا نشان میدهند که سئوی عملی و منطقی هنوز در حال مبارزه با شلوغی و اطلاعات نادرست است. پست پاتریک در لینکدین نمونهای از این تلاش است.
سئوی عملی
سئوی عملی به معنای انجام کارها بر اساس دلایل منطقی و واقعبینانه است، نه بر اساس نظراتی که بر اطلاعات ناقص و حدس و گمان استوارند. به عنوان کسی که تقریباً از ابتدای ظهور سئو در این زمینه فعالیت داشتهام، میتوانم بگویم که عدم تفکر عمیق باعث شده است که متخصصان سئو و ناشران زمان خود را بر روی مسائل مبهم تلف کنند و به فعالیتهای بیفایده مانند سیگنالهای سطحی EEAT بپردازند. واقعاً ناامیدکننده است که وقتی به مستندات و بیانیههای رسمی اشاره میکنی، با جملاتی مانند “گوگل دروغ میگوید” مواجه میشوی. این نوع نگرش واقعاً آدم را به فریاد میآورد.
بیایید کمی بیشتر به سئوی عملی و منطقی توجه کنیم.