الگوریتم گوگل پتنت ممکن است نحوه رتبه بندی را مشخص کند

الگوریتم گوگل پتنت بیل اسلاوسکی، درباره پتنتی از شرکت گوگل یادداشتی نوشته است که در آن به توضیح اتفاقاتی که برای بروزرسانی‌های پزشکی و درمانی که نام‌گذاری‌های ضعیفی داشته اند پرداخته است. بیل می‌گوید که قضیه چیزی فراتر از تنها چند سایت پزشکی است. با خواندن این پتنت ممکن است این موضوع که چرا برخی سایت‌ها در رده‌بندی قرار نمی‌گیرند را متوجه شوید.


هشداری در رابطه با پتنت

الگوریتم گوگل پتنت ممکن است نحوه رتبه بندی را مشخص کند


در مورد پتنت در نظر داشتن این نکته حائز اهمیت است که گوگل اغلب تایید نمی‌کند که آیا الگوریتمی که در یک پتنت شرح داده شده در حال استفاده است یا خیر. این پتنت ممکن است در الگوریتم گوگل مورد استفاده قرار نگیرد.


گوگل پتنت درباره ی چیست؟


این پتنت روشی را برای دسته‌بندی کوئری‌های جستوجو و وب سایت‌ها بر اساس موضوع ارائه می‌دهد.


وب سایت‌ها توسط موضوعات دسته‌بندی می‌شوند.

کوئری‌‌های جست و جو نیز توسط موضوعات دسته‌بندی می‌شوند.

موضوعات: حوزه‌های دانش


در این پتنت، الگوریتم با چیزی که آن را حوزه دانش می‌نامد، کار می‌کند. کوئری‌های جست و جو و صفحات وب را می‌توان به حوزه‌های دانش خاص اختصاص داد.


این نحوه توصیف بیل درباره حوزه‌های دانش است:


” عبارت ” حوزه دانش ” بر موضوعاتی دلالت دارند که یک کوئری‌ ممکن است در مورد آن باشد و به یک گراف دانش اشاره ندارد.”


و در این مقاله او بیان می‌کند که:


” کوئری‌هایی (کوئری) از حوزه‌های دانش خاص (پوشش‌دهنده موضوعات خاص) ممکن است نتایج را با استفاده از سایت‌هایی که با عنوان همان حوزه دانش طبقه‌بندی شده‌اند، بازگرداند.”


صفحات موضوعی


یک روش برای ساده‌سازی این مفهوم، تفکر درباره سبدهای موضوعی است. در یک سبد موضوعی صفحات مرتبط با اطلاعات پزشکی در یک سبد، صفحات در مورد سلامت طبیعی به یک سبد دیگر، صفحات مربوط به نقد و بررسی‌های تلفن همراه در یک سبد و صفحات مختلف درباره وکلای دعاوی شخصی در یک شهر خاص ممکن است به سبد دیگری بروند و این رویه به همین ترتیب ادامه دارد.


کوئری‌های موضوعی


براساس پتنت، کوئری‌ها را می‌توان با تعلق به سبد خود نیز شناسایی کرد. بنابراین وقتی کسی درباره ” دیابت چیست” جست و جو می‌کند، گوگل این کوئری‌ را به عنوان یک سوال پزشکی درک می‌کند ومی‌داند مثلاً یک سوال درباره درمان طبیعی نیست.


الگوریتم گوگل پتنت

گوگل پتنت وب سایت‌ها و کوئری‌ها را توصیف می‌کند


این روشی است که این پتنت سیستم طبقه‌بندی را توصیف می‌کند:


طبقه‌بندی وب سایت‌ها


” موتور جستوجو … ممکن است از داده یک سیستم طبقه‌بندی وب سایت استفاده کند … تا نتایج جست و جو را ایجاد کند. برای مثال، سیستم طبقه‌بندی وب سایت … ممکن است نمایشی برای هر یک از وب سایت‌ها ایجاد کند … و از این نمایش برای تعیین یک طبقه‌بندی برای هر یک از وب سایت‌ها استفاده کند … “


طبقه‌بندی کوئری‌های جست و جو


“موتور جست و جو… ممکن است از یک طبقه‌بندی برای یک کوئری‌ استفاده کند تا یک دسته از وب سایت‌ها با همان طبقه‌بندی و یا یک طبقه‌بندی مشابه انتخاب کند.


موتور جست و جو … ممکن است نتایج جست و جو را از دسته انتخابی وب سایت‌ها تعیین کند. “


سایت‌هایی که به چندین خوشه‌ (کلاستر) دسته‌بندی می‌شوند


پتنت، فرآیندی را توصیف می‌کند که وب سایت‌ها را از طریق طبقه‌بندی آن‌ها سازماندهی می‌کند.


” … سیستم‌ها و روش‌های شرح‌داده‌شده در این سند ممکن است صفحات نتایج جست و جو ایجاد شده توسط یک سیستم جست و جو را با شناسایی سایت‌هایی که تنها در یک طبقه‌بندی خاص قارار می‌گیرند، بهبود بخشند … “


سیستم طبقه‌بندی می‌تواند خوشه‌ها را براساس احتمال اینکه یک وب سایت حاوی پاسخ به یک پرسش باشد یا نه، ایجاد کند:


” سیستم طبقه‌بندی وب سایت … ممکن است طبقه‌بندی‌های مبتنی بر پاسخگویی محتمل برای وب سایت‌ها در خوشه مربوطه را تعیین کند.


برای مثال, وب سایت‌های درون اولین خوشه ممکن است احتمال بیشتری نسبت به کوئری‌‌های در حوزه دانش خاص نسبت به وب سایت‌ها در خوشه دوم داشته باشند. “


سپس سناریوهایی را توصیف می‌کند که در آن‌ها یک سایت ممکن است حذف شود و طبقه‌بندی نشود.


چیزی که جالب است این است که این روش تجزیه و تحلیل پرشی را نشان می‌دهد، زیرا خوشه‌ای که یک سایت در آن قرار دارد, از خوشه‌های شناخته‌شده سایت در مورد یک موضوع فاصله دارد.


” در برخی از پیاده‌سازی‌ها، یک یا چند وب سایت مورد استفاده در حین آموزش ممکن است به یک طبقه‌بندی تخصیص داده نشود. برای مثال، زمانی که یک نمایش وب سایت بیش از یک فاصله آستانه از یک خوشه باشد، یا در غیر این صورت در یک خوشه گنجانده نشده باشند، سیستم طبقه‌بندی وب سایت … ممکن است تشخیص دهد که از پرش بیشتری برای وب سایت در حین آموزش استفاده کند.”


اقتدار، نوعی طبقه‌بندی است.


“هر سایتی در مجموعه سایت‌ها دارای یک امتیاز است؛ این امتیاز ممکن است به نوعی نشانگر طبقه‌بندی وب سایت ، مانند یک نوع اقندار، قدرت پاسخگویی برای حوزه دانش خاص و یا ویژگی دیگری از وب سایت ، یا ترکیبی از دو یا چند مورد از این‌ها را نشان دهد.”


این پتنت درباره چیزی فراتر از سایت‌های پزشکی است.


چیزی که مهم است بدانیم این است که فرایند توصیف‌شده در این پتنت بر محدوده گسترده‌ای از موقعیت‌های موضوعات اعمال می‌شود. این یک الگوریتم پزشکی نیست؛ این خیلی بیشتر از یک پتنت پزشکی است”


طبق گفته های بیل :


” حق انحصار بیش از تنها سایت‌های پزشکی بود. این به وسیله صنعت با بهداشت – تنها یکی از آن‌ها – طبقه‌بندی شده‌است. بعداً با نمرات کیفی دسته‌بندی شد.


پتنت یک نمونه خاص برای سایت‌های پزشکی ارائه کرد … اما مشخص کرد که شامل چندین صنعت گوناگون است نه فقط پزشکی.


کوئری‌ها در حوزه دانش نیز دسته‌بندی شدند.”


نکته مهم: پیامدهای رده‌بندی


بخش رتبه‌بندی جذاب است زیرا ویژگی‌هایی چون اقتدار و مقدار فاصله از خوشه‌های دیگری از سایت‌ها را ذکر می‌کند.


یک معیار قدرت، پیوند (لینک)ها هستند. و تحقیقات زیادی در مورد الگوریتم‌هایی وجود دارد که وب سایت‌ها را با توجه به موضوعات مختلف دسته‌بندی می‌کنند. الگوریتم ‌هایی که سایت‌هایی را انتخاب می‌کنند که معتبرترین وب سایت را در یک طبقه‌بندی موضوعی خاص نشان می‌دهند. سپس سایت‌های دیگر براساس این که چقدر از سایت‌های اصلی (هسته) دور هستند، به ثبت رسیدند.


این الگوریتم از یک سیستم مشابه استفاده می‌کند که در آن سایتی که از خوشه‌های دیگر فاصله دارد ، اساساً دور ریخته شده و برای رتبه‌بندی درنظر گرفته نمی‌شود.


هیچ چیزی درباره پیوندهای داخل زمینه که استفاده از آن‌ها به عنوان معیاری برای اندازه‌گیری اقتدار (قدرت) باشد گفته نشده است. اما تشابهات بین الگوریتم‌های رتبه‌بندی فاصله لینک‌ها، که سایت‌ها را با توجه به موضوعات دسته‌بندی می‌کنند، و خوشه‌هایی از سایت‌های مبتنی بر این موضوعات می‌سازند به مثابه یک آینه است که نشان می‌دهد چگونه این الگوریتم خوشه‌بندی مشابهی را با موضوعات محتوایی انجام می‌دهد.


ممکن است منطقی نباشد که تصور کنیم این موضوع عموماً این اعتقاد را تقویت می‌کند (و آن را ضروری می‌سازد) که پیوندها از صفحات مرتبط ممکن است رتبه‌بندی‌ها را بهبود بخشد.


نکته مهم: بازیابی به روز رسانی گوگل


این بینش‌ها در الگوریتم گوگل پیشنهادهای من در مورد بازیابی به روز رسانی گوگل را طور کلی و بازیابی از به روز رسانی پزشکی به طور خاص را تایید می‌کند.


“به نظر می‌رسد “به روزرسانی به اصطلاح” پزشکی “در مورد مسائل مربوط به موضوع اهمیت دارد، نه زندگی نامه نویسنده یا” تخصص ” او.”


شاید یکی از دیدگاههای مهم این پتنت این باشد که بتوان به بررسی رتبه بندی موضوعات از منظر اهمیت کمک کرد. با توجه به تجربه من در مشاوره با سایت‌هایی که رتبه بندی خود را از دست داده اند، اگر رتبه سایت شما دچار یک افت فاجعه بار شده است، می‌تواند تا حدودی با چیزی مشابه آنچه در این پتنت شرح داده شده باشد، مرتبط باشد.


اما اگر سایت شما تنها چند رتبه در کل صفحه نتایج تنزل داشته است، آنگاه ممکن است موضوعات دیگری مانند افزایش رقابت و یا مقدار مرتبط بودن درمیان باشد.