الگوریتم گوگل پتنت ممکن است نحوه رتبه بندی را مشخص کند
الگوریتم گوگل پتنت بیل اسلاوسکی، درباره پتنتی از شرکت گوگل یادداشتی نوشته است که در آن به توضیح اتفاقاتی که برای بروزرسانیهای پزشکی و درمانی که نامگذاریهای ضعیفی داشته اند پرداخته است. بیل میگوید که قضیه چیزی فراتر از تنها چند سایت پزشکی است. با خواندن این پتنت ممکن است این موضوع که چرا برخی سایتها در ردهبندی قرار نمیگیرند را متوجه شوید.
هشداری در رابطه با پتنت
در مورد پتنت در نظر داشتن این نکته حائز اهمیت است که گوگل اغلب تایید نمیکند که آیا الگوریتمی که در یک پتنت شرح داده شده در حال استفاده است یا خیر. این پتنت ممکن است در الگوریتم گوگل مورد استفاده قرار نگیرد.
گوگل پتنت درباره ی چیست؟
این پتنت روشی را برای دستهبندی کوئریهای جستوجو و وب سایتها بر اساس موضوع ارائه میدهد.
وب سایتها توسط موضوعات دستهبندی میشوند.
کوئریهای جست و جو نیز توسط موضوعات دستهبندی میشوند.
موضوعات: حوزههای دانش
در این پتنت، الگوریتم با چیزی که آن را حوزه دانش مینامد، کار میکند. کوئریهای جست و جو و صفحات وب را میتوان به حوزههای دانش خاص اختصاص داد.
این نحوه توصیف بیل درباره حوزههای دانش است:
” عبارت ” حوزه دانش ” بر موضوعاتی دلالت دارند که یک کوئری ممکن است در مورد آن باشد و به یک گراف دانش اشاره ندارد.”
و در این مقاله او بیان میکند که:
” کوئریهایی (کوئری) از حوزههای دانش خاص (پوششدهنده موضوعات خاص) ممکن است نتایج را با استفاده از سایتهایی که با عنوان همان حوزه دانش طبقهبندی شدهاند، بازگرداند.”
صفحات موضوعی
یک روش برای سادهسازی این مفهوم، تفکر درباره سبدهای موضوعی است. در یک سبد موضوعی صفحات مرتبط با اطلاعات پزشکی در یک سبد، صفحات در مورد سلامت طبیعی به یک سبد دیگر، صفحات مربوط به نقد و بررسیهای تلفن همراه در یک سبد و صفحات مختلف درباره وکلای دعاوی شخصی در یک شهر خاص ممکن است به سبد دیگری بروند و این رویه به همین ترتیب ادامه دارد.
کوئریهای موضوعی
براساس پتنت، کوئریها را میتوان با تعلق به سبد خود نیز شناسایی کرد. بنابراین وقتی کسی درباره ” دیابت چیست” جست و جو میکند، گوگل این کوئری را به عنوان یک سوال پزشکی درک میکند ومیداند مثلاً یک سوال درباره درمان طبیعی نیست.
الگوریتم گوگل پتنت
گوگل پتنت وب سایتها و کوئریها را توصیف میکند
این روشی است که این پتنت سیستم طبقهبندی را توصیف میکند:
طبقهبندی وب سایتها
” موتور جستوجو … ممکن است از داده یک سیستم طبقهبندی وب سایت استفاده کند … تا نتایج جست و جو را ایجاد کند. برای مثال، سیستم طبقهبندی وب سایت … ممکن است نمایشی برای هر یک از وب سایتها ایجاد کند … و از این نمایش برای تعیین یک طبقهبندی برای هر یک از وب سایتها استفاده کند … “
طبقهبندی کوئریهای جست و جو
“موتور جست و جو… ممکن است از یک طبقهبندی برای یک کوئری استفاده کند تا یک دسته از وب سایتها با همان طبقهبندی و یا یک طبقهبندی مشابه انتخاب کند.
موتور جست و جو … ممکن است نتایج جست و جو را از دسته انتخابی وب سایتها تعیین کند. “
سایتهایی که به چندین خوشه (کلاستر) دستهبندی میشوند
پتنت، فرآیندی را توصیف میکند که وب سایتها را از طریق طبقهبندی آنها سازماندهی میکند.
” … سیستمها و روشهای شرحدادهشده در این سند ممکن است صفحات نتایج جست و جو ایجاد شده توسط یک سیستم جست و جو را با شناسایی سایتهایی که تنها در یک طبقهبندی خاص قارار میگیرند، بهبود بخشند … “
سیستم طبقهبندی میتواند خوشهها را براساس احتمال اینکه یک وب سایت حاوی پاسخ به یک پرسش باشد یا نه، ایجاد کند:
” سیستم طبقهبندی وب سایت … ممکن است طبقهبندیهای مبتنی بر پاسخگویی محتمل برای وب سایتها در خوشه مربوطه را تعیین کند.
برای مثال, وب سایتهای درون اولین خوشه ممکن است احتمال بیشتری نسبت به کوئریهای در حوزه دانش خاص نسبت به وب سایتها در خوشه دوم داشته باشند. “
سپس سناریوهایی را توصیف میکند که در آنها یک سایت ممکن است حذف شود و طبقهبندی نشود.
چیزی که جالب است این است که این روش تجزیه و تحلیل پرشی را نشان میدهد، زیرا خوشهای که یک سایت در آن قرار دارد, از خوشههای شناختهشده سایت در مورد یک موضوع فاصله دارد.
” در برخی از پیادهسازیها، یک یا چند وب سایت مورد استفاده در حین آموزش ممکن است به یک طبقهبندی تخصیص داده نشود. برای مثال، زمانی که یک نمایش وب سایت بیش از یک فاصله آستانه از یک خوشه باشد، یا در غیر این صورت در یک خوشه گنجانده نشده باشند، سیستم طبقهبندی وب سایت … ممکن است تشخیص دهد که از پرش بیشتری برای وب سایت در حین آموزش استفاده کند.”
اقتدار، نوعی طبقهبندی است.
“هر سایتی در مجموعه سایتها دارای یک امتیاز است؛ این امتیاز ممکن است به نوعی نشانگر طبقهبندی وب سایت ، مانند یک نوع اقندار، قدرت پاسخگویی برای حوزه دانش خاص و یا ویژگی دیگری از وب سایت ، یا ترکیبی از دو یا چند مورد از اینها را نشان دهد.”
این پتنت درباره چیزی فراتر از سایتهای پزشکی است.
چیزی که مهم است بدانیم این است که فرایند توصیفشده در این پتنت بر محدوده گستردهای از موقعیتهای موضوعات اعمال میشود. این یک الگوریتم پزشکی نیست؛ این خیلی بیشتر از یک پتنت پزشکی است”
طبق گفته های بیل :
” حق انحصار بیش از تنها سایتهای پزشکی بود. این به وسیله صنعت با بهداشت – تنها یکی از آنها – طبقهبندی شدهاست. بعداً با نمرات کیفی دستهبندی شد.
پتنت یک نمونه خاص برای سایتهای پزشکی ارائه کرد … اما مشخص کرد که شامل چندین صنعت گوناگون است نه فقط پزشکی.
کوئریها در حوزه دانش نیز دستهبندی شدند.”
نکته مهم: پیامدهای ردهبندی
بخش رتبهبندی جذاب است زیرا ویژگیهایی چون اقتدار و مقدار فاصله از خوشههای دیگری از سایتها را ذکر میکند.
یک معیار قدرت، پیوند (لینک)ها هستند. و تحقیقات زیادی در مورد الگوریتمهایی وجود دارد که وب سایتها را با توجه به موضوعات مختلف دستهبندی میکنند. الگوریتم هایی که سایتهایی را انتخاب میکنند که معتبرترین وب سایت را در یک طبقهبندی موضوعی خاص نشان میدهند. سپس سایتهای دیگر براساس این که چقدر از سایتهای اصلی (هسته) دور هستند، به ثبت رسیدند.
این الگوریتم از یک سیستم مشابه استفاده میکند که در آن سایتی که از خوشههای دیگر فاصله دارد ، اساساً دور ریخته شده و برای رتبهبندی درنظر گرفته نمیشود.
هیچ چیزی درباره پیوندهای داخل زمینه که استفاده از آنها به عنوان معیاری برای اندازهگیری اقتدار (قدرت) باشد گفته نشده است. اما تشابهات بین الگوریتمهای رتبهبندی فاصله لینکها، که سایتها را با توجه به موضوعات دستهبندی میکنند، و خوشههایی از سایتهای مبتنی بر این موضوعات میسازند به مثابه یک آینه است که نشان میدهد چگونه این الگوریتم خوشهبندی مشابهی را با موضوعات محتوایی انجام میدهد.
ممکن است منطقی نباشد که تصور کنیم این موضوع عموماً این اعتقاد را تقویت میکند (و آن را ضروری میسازد) که پیوندها از صفحات مرتبط ممکن است رتبهبندیها را بهبود بخشد.
نکته مهم: بازیابی به روز رسانی گوگل
این بینشها در الگوریتم گوگل پیشنهادهای من در مورد بازیابی به روز رسانی گوگل را طور کلی و بازیابی از به روز رسانی پزشکی به طور خاص را تایید میکند.
“به نظر میرسد “به روزرسانی به اصطلاح” پزشکی “در مورد مسائل مربوط به موضوع اهمیت دارد، نه زندگی نامه نویسنده یا” تخصص ” او.”
شاید یکی از دیدگاههای مهم این پتنت این باشد که بتوان به بررسی رتبه بندی موضوعات از منظر اهمیت کمک کرد. با توجه به تجربه من در مشاوره با سایتهایی که رتبه بندی خود را از دست داده اند، اگر رتبه سایت شما دچار یک افت فاجعه بار شده است، میتواند تا حدودی با چیزی مشابه آنچه در این پتنت شرح داده شده باشد، مرتبط باشد.
اما اگر سایت شما تنها چند رتبه در کل صفحه نتایج تنزل داشته است، آنگاه ممکن است موضوعات دیگری مانند افزایش رقابت و یا مقدار مرتبط بودن درمیان باشد.