اخیراً در شبکه‌ی اجتماعی لینکدین، پستی منتشر شده است که در آن به این موضوع پرداخته شده که آیا داده‌های ساختاریافته‌ی Schema.org بر خروجی مدل‌های زبانی بزرگ (LLM) تأثیر می‌گذارند یا خیر. به نظر می‌رسد برخی از متخصصان سئو در حال توصیه‌ی استفاده از داده‌های ساختاریافته برای بهبود رتبه‌بندی در موتورهای جستجوی هوش مصنوعی هستند.

پاتریک استوکس در پستی در لینکدین نوشته است:
“آیا من چیزی را از دست داده‌ام؟ چرا متخصصان سئو فکر می‌کنند که نشانه‌گذاری Schema بر خروجی مدل‌های زبانی بزرگ تأثیر می‌گذارد؟”
به نظر می‌رسد منظور او از “خروجی مدل‌های زبانی بزرگ” به موتورهای جستجوی هوش مصنوعی مانند ChatGPT Search اشاره دارد. اما آیا موتورهای جستجوی هوش مصنوعی داده‌های خود را از طریق داده‌های ساختاریافته دریافت می‌کنند؟

مدل‌های زبانی بزرگ (LLM) بر اساس متن‌های وب، کتاب‌ها، اسناد دولتی، مدارک حقوقی و سایر داده‌های متنی (و همچنین سایر فرم‌های رسانه‌ای) آموزش داده می‌شوند. این داده‌ها برای تولید خلاصه‌ها و پاسخ‌ها استفاده می‌شوند، اما بدون کپی‌برداری مستقیم از داده‌های آموزشی. بنابراین، این تصور که بهینه‌سازی محتوای وب می‌تواند منجر به ارجاع مستقیم مدل‌های زبانی بزرگ به یک وب‌سایت شود، بی‌معنی است.

موتورهای جستجوی هوش مصنوعی بر اساس شاخص‌های جستجو (و گراف‌های دانش) از طریق روشی به نام تولید تقویت‌شده با بازیابی (RAG) عمل می‌کنند. شاخص‌های موتورهای جستجو نیز از داده‌های خزیده‌شده ایجاد می‌شوند، نه از داده‌های ساختاریافته‌ی Schema. به عنوان مثال، Perplexity AI از نسخه‌ی اصلاح‌شده‌ی الگوریتم PageRank برای رتبه‌بندی محتوای خزیده‌شده استفاده می‌کند. گوگل و بینگ نیز متن‌ها را از HTML استخراج می‌کنند و کارهایی مانند حذف محتوای تکراری، حذف کلمات توقف و سایر پردازش‌ها را انجام می‌دهند. علاوه بر این، همه‌ی صفحات وب حاوی داده‌های ساختاریافته نیستند.

در واقع، گوگل تنها از بخش کوچکی از داده‌های ساختاریافته‌ی Schema.org برای تجربه‌های جستجوی خاص و نتایج غنی استفاده می‌کند، که این موضوع باعث محدود شدن نوع داده‌های ساختاریافته‌ای می‌شود که ناشران از آن استفاده می‌کنند.

همچنین، هر دو موتور جستجوی گوگل و بینگ HTML را رندر می‌کنند، هدرها، فوترها و محتوای اصلی را شناسایی می‌کنند و متن را برای اهداف رتبه‌بندی استخراج می‌کنند. اگر قرار بود به داده‌های ساختاریافته‌ی Schema تکیه کنند، چرا این کار را انجام می‌دادند؟

این ایده که استفاده از داده‌های ساختاریافته‌ی Schema.org می‌تواند به رتبه‌بندی بهتر در موتورهای جستجوی هوش مصنوعی کمک کند، بر اساس واقعیت‌ها نیست و بیشتر شبیه به حدس و گمان است. یا ممکن است نتیجه‌ی یک “بازی تلفن” باشد، جایی که یک نفر چیزی می‌گوید و پس از گذراندن چندین نفر، به چیزی کاملاً متفاوت تبدیل می‌شود.

به عنوان مثال، جونو آلدرسون پیشنهاد داده است که داده‌های ساختاریافته می‌توانند به عنوان یک استاندارد برای کمک به موتورهای جستجوی هوش مصنوعی در درک بهتر وب مورد استفاده قرار گیرند. او نگفته بود که موتورهای جستجوی هوش مصنوعی در حال حاضر از این داده‌ها استفاده می‌کنند، بلکه فقط پیشنهاد کرده بود که ممکن است در آینده از آن استفاده کنند. اما به نظر می‌رسد این ایده پس از گذراندن چندین نفر، به یک نظریه‌ی کامل تبدیل شده است.

متأسفانه، در جامعه‌ی سئو ایده‌های بی‌پایه و اساس زیادی وجود دارد. به عنوان مثال، اخیراً دیده‌ام که یک متخصص سئو در شبکه‌های اجتماعی ادعا کرده است که گوگل از آدرس‌های IP برای پاسخ به جستجوهای “نزدیک من” استفاده نمی‌کند. برای آزمایش این ادعا، کافی است از یک VPN استفاده کنید، یک موقعیت جغرافیایی برای آدرس IP خود انتخاب کنید و یک جستجوی “نزدیک من” انجام دهید. خواهید دید که آدرس IP مورد استفاده توسط VPN بر نتایج جستجو تأثیر می‌گذارد.

گوگل حتی یک صفحه‌ی پشتیبانی منتشر کرده است که در آن توضیح داده شده است که از آدرس IP برای شخصی‌سازی نتایج جستجو استفاده می‌کند. با این حال، برخی افراد به دلیل مطالعات همبستگی انجام‌شده توسط برخی متخصصان سئو، به این موضوع اعتقاد ندارند و حتی وقتی با مستندات رسمی مواجه می‌شوند، ادعا می‌کنند که “گوگل دروغ می‌گوید.”

آیا به چشمان خود اعتماد خواهید کرد؟

در نهایت، توصیه‌ی استفاده از داده‌های ساختاریافته‌ی Schema.org برای آموزش مدل‌های زبانی بزرگ نیز منطقی به نظر نمی‌رسد، زیرا داده‌های آموزشی در خروجی مدل‌های زبانی بزرگ ذکر نمی‌شوند. همان‌طور که قبلاً اشاره شد، ناشران تنها از بخش کوچکی از داده‌های ساختاریافته‌ی Schema.org استفاده می‌کنند، زیرا گوگل نیز تنها از بخش کوچکی از آن استفاده می‌کند. بنابراین، منطقی نیست که یک موتور جستجوی هوش مصنوعی برای خروجی خود به داده‌های ساختاریافته تکیه کند.

کریستوفر شین، متخصص بازاریابی جستجو، در این باره نظر داده است:
“من هم پس از خواندن پست شما پاتریک، به همین نتیجه رسیدم. به نظر من، مدل‌های زبانی بزرگ معمولاً پاسخ‌های خود را از صفحات نتایج موتورهای جستجو تولید نمی‌کنند، بلکه از تفسیر داده‌ها استفاده می‌کنند. درست است؟ اما داده‌های ساختاریافته‌ی Schema توسط موتورهای جستجو برای نمایش نتایج غنی در صفحات نتایج استفاده می‌شوند. تفاوت کلیدی این است که موتورهای جستجو از Schema برای صفحات نتایج استفاده می‌کنند، در حالی که مدل‌های زبانی بزرگ از تفسیر داده‌ها برای تأثیر Schema بر خروجی خود استفاده می‌کنند.”

افرادی مانند کریستوفر شین و پاتریک استوکس امیدوارکننده هستند، زیرا نشان می‌دهند که سئوی عملی و منطقی هنوز در حال مبارزه با شلوغی و اطلاعات نادرست است. پست پاتریک در لینکدین نمونه‌ای از این تلاش است.

سئوی عملی
سئوی عملی به معنای انجام کارها بر اساس دلایل منطقی و واقع‌بینانه است، نه بر اساس نظراتی که بر اطلاعات ناقص و حدس و گمان استوارند. به عنوان کسی که تقریباً از ابتدای ظهور سئو در این زمینه فعالیت داشته‌ام، می‌توانم بگویم که عدم تفکر عمیق باعث شده است که متخصصان سئو و ناشران زمان خود را بر روی مسائل مبهم تلف کنند و به فعالیت‌های بی‌فایده مانند سیگنال‌های سطحی EEAT بپردازند. واقعاً ناامیدکننده است که وقتی به مستندات و بیانیه‌های رسمی اشاره می‌کنی، با جملاتی مانند “گوگل دروغ می‌گوید” مواجه می‌شوی. این نوع نگرش واقعاً آدم را به فریاد می‌آورد.

بیایید کمی بیشتر به سئوی عملی و منطقی توجه کنیم.