گراف دانش یا Knowledge Graph چیست؟ (توضیحات جامع)
اگر می خواهید که گوگل از دید یک انسان به محتوای وبسایت شما نگاه کند باید به ساخت گراف دانش (Knowledge Graph) به آن کمک کنید. گراف دانش در اصل مثل یک دایره المعارف است که موتور جستجوی گوگل برای درک بهتر محتوای صفحات وب و ارتقای کیفیت صفحات نتایج به آن مراجعه می کند. به طور کلی، گوگل با استناد به گراف دانش سعی دارد تا در کوتاه ترین زمان و به شکل قابل درک مطالب اولیه درباره یک موضوع را به کاربران نمایش دهد.
گوگل با داده ها سر و کار دارد و هرچه محتوای شما ساده تر باشد، گوگل راحت تر آن را درک کرده و محتوای آن را به کاربران نمایش می دهد. اگر به راحتی با گوگل کنار بیایید باید مفهوم گراف دانش و نحوه عملکرد آن را درک کنید. در این مقاله از داناپ قصد داریم، Google Knowledge Graph یا همان گراف دانش گوگل را مورد بررسی قرار داده و نحوه عملکرد آن را با یکدیگر مرور خواهیم کرد، پس تا آخر با ما همراه باشید.
گراف دانش چیست؟
گراف دانش به گوگل می کند که داده های ساختار یافته (Structured Data) یک محتوا را درک کنند. داده های موجود در محتوای صفحات وب به صورت معنایی و علائم نشانه گذاری هستند که به پیوند مفاهیم و ایده ها کمک می کنند. این داده ها در اصل محتوای صفحات وب را به داده های ساختار یافته تبدیل می کنند که در گراف دانش به کاربران نمایش داده می شوند. اگر کارشناسان سئو می خواهند که گوگل معنای محتوای صفحات وبسایت آنها را بهتر بفهمد باید نحوه عملکرد گراف دانش را به خوبی باید بگیرند.
اگر بخواهیم با جزییات بیشتر گراف دانش را توضیح دهیم باید آن را چیزی ما بین دایره المعارف و دیتابیس در نظر بگیریم. هر محتوایی که در صفحات وجود دارد از نظر توسعه دهندگان به عنوان یک «Entity» یا همان موجودیت و از نظر گوگل به عنوان یک «Topic» یا همان موضوع در صفحات نتایج به کاربران نمایش داده می شود.
این Topic می تواند درباره هر موضوعی باشد و مانند هر دیتابیس دیگری دارای یک شناسه منحصربفرد است که اغلب می توان آن را در آدرس های URL گوگل مشاهده کرد. برای مثال، آدرس [kgmid=/g/11f0vfyswk&hl] که بخش اول یعنی kgmid می تواند با توجه به نوع موضوع تغییر کند. به طور کلی چند پارامتر برای یک Topic می توانید وجود داشته باشد که در ادامه برخی از آنها را معرفی خواهیم کرد:
- یک نام یا لیبل مثل Cristiano Ronaldo
- یک پارامتر مربوط به Type مثل Person (شخص)
- یک Description مثل Football Player در مثال Cristiano Ronaldo
- فهرستی از URLهای دارای تصاویر که اغلب دارای استانداردهای کپی رایت است
- توضیحات خلاصه (اغلب بخشی از متن محتوا به همراه URL منبع)
البته، گوگل بیان کرده است که اطلاعات لیست فوق در برخی اوقات ممکن است به صورت مستقیم در APIهای جستجو آنها موجود باشد. با این حال، این داده ها را به صورت داخلی نیز افزایش می دهند. برای مثال، در مثال کریستیانو رونالدو ممکن است تاریخ تولد، نام همسر و فرزندان و تیم های باشگاهی وی نیز در گراف دانش نمایش داده شود.
همانطور که مشاهده می کنید چنین موضوعی خیلی با یک دایره المعارف فاصل ندارد ولی به خاطر حقایقی درباره زندگی رونالدو نظیر نام هسمر و فرزندان، گوگل بهتر می تواند نقاط مبهم صفحات وب را به یکدیگر متصل کرده و در نتیجه محتوای آن را راحت تر درک کند. علاوه بر این، اگر کاربر دیگری سوال بپرسد که اسم فرزندان کریستیانو کیست، گوگل به راحتی متوجه منظور وی شده و اطلاعات صحیح را به وی ارائه می کند.
نکات مهم درباره گراف دانش
به جز گراف دانش گوگل، گراف های دیگری نظیر dbpedia.com و Wikidata.org در دنیای اینترنت وجود دارند. در حقیقت، هر داده ساختار یافته یا حتی نیمه ساختار یافته ای می تواند به عنوان یک گراف دانش در نظر گرفته شود. برای مثال، دیتابیس هایی نظیر IMDB یا ویکی پدیا را می توان به عنوان یک گراف دانش توصیف کرد. چیزی که در این بین مشخص است، بدست آوردن داده های اطلاعات گراف دانش گوگل از وبسایت هایی نظیر ویکی پدیا و دیتابیس CIA تهیه شده است.
یک دیدگاه غلط دیگری که درباره گراف دانش وجود دارد این است که اغلب کاربران پنل دانش گوگل (Google Knowledge Panel) را با گراف دانش اشتباه می گیرند. البته، در برخی اوقات ممکن است که پنل دانش زیر مجموعه ای از داده های گراف دانش را نمایش دهد. در حقیقت، پنل دانش مجموعه ای از داده های به هم پیوسته از دانش گراف است که به صورت تصویری به کاربر نمایش داده می شوند اما گراف دانش آیتم های تصویری کمتری درباره موضوع یا همان Topic ارائه می دهد.
در آخر ابهاماتی درباره واژگان مربوط به گراف دانش وجود دارد که توضیح آن خالی از لطف نیست. به طور کلی، داده های موجود در گراف دانش به عنوان یک Entity شناخته می شوند، در حالی گوگل در اسناد خود به آن ها به چشم یک «موضوع» نگاه می کند.
به طور کلی، به هر Entity یک Type نظیر شخص، سازمان کشور یا مکان داده می شود. اگر هیچکدام از این تایپ ها در دسترس نباشند، لیبل Thing به آن داده می شود. البته، فراموش نکنید که گوگل به طور مستمر داده های مربوط به یک Entity را بروزرسانی می کند. در حقیقت، API پردازش زبان طبیعی گوگل (Google Natural Language Processing) به ما ثابت می کند که گوگل از انواع تایپ ها نظیر «آثار هنری» و «کالاهای مصرفی» نیز برای توسعه گراف دانش استفاده می کند.
همانطور که مشاهده کردید، گراف دانش گوگل ساعت به ساعت در حال توسعه و بروزرسانی است. با این حال، به نظر می رسد هنوز هم نمی تواند Entity ها را به شکل درستی دسته بندی نماید.علاوه بر این، تحقیقات انجام شده نشان می دهد که تنها 20% از Entityها توسط الگوریتم های پردازیش زبان طبیعی گوگل شناخته می شوند.
مزایای گراف دانش گوگل
با سازماندهی داده های جهانی و دسته بندی آنها به Topicهای مختلف، موتورهای جستجوگر به جای خزیدن در وبسایت و ایندکس کردن صفحات آن می توانند از مزایای زیادی نظیر یکپارچگی اطلاعات، مقیاس پذیری و سرعت بالا بهره مند شوند. در ادامه هر کدام از مزایای گراف دانش گوگل را به صورت خلاصه با یکدیگر مرور خواهیم کرد.
1- مقیاس پذیری
تعداد زیاد صفحات وب همواره یکی از موضوعات بحث برانگیز در دنیای ایترنت است. برخی از مردم معتقدند که تعداد صفخات وب بی نهایت است. البته، این افراد خیلی بیراه هم صحبت نمی کنند چون حدود تیلیاردها صفحه وب در دنیا وجود دارد که روز به روز به تعداد آنها افزوده می شود. در طرف دیگر، موضوعاتی که انسان می تواند آنها را درک کند بسیار کمتر و در حدود صدها میلیارد است که با سرعت کمتری نیز در حال رشد خواهد بود.
به عبارت دیگر می توان گفت که این موضوع نشان دهنده وجود بی رویه محتوای تکراری درون اینترنت است. گراف دانش کمک می کند تا اطلاعات ساختار یافته مربوط به یک موضوع در یکجا جمع شود. این موضوع باعث می شود که داده ها فضای کمتری در اینترنت اشغال کنند و از این طریق محتوای تکراری کمتری نیز به وجود خواهد آمد.
2- تنوع منابع اطلاعاتی
ذخیره داده های مربوط به یک Topic به گوگل این امکان را می دهد تا به جای هدایت کاربر به یک صفحه وب، محتوای منابع اطلاعاتی مختلف را به وی نمایش دهند. به عبارت دیگر می توان گفت که گوگل به کمک گراف دانش می تواند حقایق مربوط به یک Topic را جمع آوری کرده و به صورت خلاصه به کاربران نمایش دهد. فراموش نکنید که اطلاعات مربوط به یک Topic ممکن است از منابعی فراتر از اینترنت به دست گوگل رسیده باشد.
3- یکپارچگی داده ها
گراف دانش با وجود پیشرفت ها و بروزرسانی های مستمر همچنان دارای باگ است و ممکن است اطلاعات غلط به کارشناسان سئو بدهد. علاوه بر این، افراد خرابکار نیز ممکن است از داده های آن برای مقاصد مجرمانه استفاده کنند. با این حال، گراف دانش این مزیت را دارد تا با دسته بندی داده ها، حداقل برای موضوعاتی که خیلی حساس نیستند، یک نقطه مشخص حقیقتیاب در اختیار موتور جستجوی گوگل قرار دهد.
البته، ممکن است حقایقی جدید درباره یک موضوع در دنیا آشکار شود. شاید فکر کنید، این موضوعات برای اضافه شدن به گراف دانش گوگل باید از فیلترهای به خصوصی عبور کنند اما بعید است گوگل به صورت آشکار درباره چگونگی انجام آن بحث کند. البته، این موضوع یک نقص بزرگ نیز دارد. اگر گوگل با استناد به یک نقطه مشخص حقیقت یاب فعالیت کند، تنوع اطلاعات کمتر خواهد شد و اگر منابع اطلاعاتی خود جانبدارانه باشند، مطالب استخراج شده از آن منبع نیز متعصبانه خواهد بود.
4- سرعت بالای بازیابی اطلاعات
همانطور که پیشتر به آن اشاره کردیم، گراف دانش گوگل اطلاعات را بر اساس Topicها سازماندهی می کند. این موضوع باعث می شود که گوگل بتواند با سرعت بیشتری اطلاعات را پردازش و بازیابی کند. علاوه بر این، کاربرانی که در یک انبار کاه به دنبال سوزن هستند نیز می توانند با سرعت بسیار بالایی نتایج مربوط به جستجوی خود را مشاهده کنند.
گراف دانش گوگل چگونه کار می کند؟
در قسمتی از این مطلب، به تفاوت بین پنل دانش و گراف دانش اشاره کردیم. در واقع این موضوع سئوکاران را مجاب به استفاده از گراف دانش کرده است چون آن ها نمی خواهند از بروزرسانی و فناوری های موتور جستجوی گوگل عقب بمانند. کاربران تلفن های هوشمند اندروید بیشترین برخورد را با گراف دانش گوگل دارند. در واقع، قابلیت Google Discover موجود در بخش Home Screen گوشی های اندرویدی جایی است که گراف دانش گوگل همواره در دسترس کاربران قرار دارد.
در حقیقت، گوگل می تواند با پردازش رفتار شما، اطلاعات مربوط به موضوعاتی که شاید برایتان مهم باشند را درک کند. علاوه بر این، گوگل قادر است تا با توجه به سوابق جستجوی کاربران، موضوعاتی مورد علاقه آن ها در گراف دانش نمایش دهد. این اطلاعات را می توان در گوگل ترندز نیز مشاهده کرد. در واقع، گوگل موضوعاتی که ممکن است با یکدیگر مرتبط باشند را در گوگل ترندز نمایش خواهد داد.
البته، این موضوعات معمولاً متعلق به فهرست جستجوی کاربران دیگر است و در برخی اوقات ممکن است نتیجه غیرمنتظره و اشتباه داشته باشد. علاوه بر این، گوگل API مربوط به جستجوی گراف دانش را نیز در اختیار کاربرن قرار می دهد؛ خروجی این API در اصل مربوط به مشخص کردن Entityها است.
جستجوی گوگل (Google Search)
گوگل سرچ و پنل دانش نتایج را در بهترین فرم به کاربران اراده می دهند. اگر شما یک سوال را در گوگل جستجو کنید، گراف دانش بهترین و دقیق ترین نتایج را در صفحات نتایج (SERP) به شما نمایش خواهد داد. البته، این موضوع عموماً به ضرر وبسایت های دیگر می شود و کاربرن خیلی به گزینه های دیگر موجود در صفحه اول گوگل توجه نمی کنند. در حقیقت، اگر شما واژه ای را در گوگل جسجو کنید، به احتمال خیلی زیاد جواب خود را در گراف دانش مشاهده خواهید کرد و به سراغ لینک های دیگر نخواهید رفت.
بد نیست بدانید که داده های موجود در گراف دانش از طریق جستجوی صوتی نیز ممکن است به کاربران نمایش داده شوند. علاوه بر این، جستجوی تصویری نیز داده های مربوط به Entity را نمایش می دهند. برای مثال، اگر شما نام یک بازیگر در یک فیلم سینمایی را در داخل گوگل جستجو کنید، اسامی بازیگران یگر آن فیلم نیز به صورت تصویری در بالای صفحه جستجو به شما نمایش داده خواهد شد. در حقیقت، این اتفاق بهترین مثال از نحوه عملکرد گراف دانش گوگل است و این که چطور گراف دانش از داده های منابعی به جز صفحات وب استفاده می کند.
انواع گراف دانش
گراف دانش گوگل انواع مختلفی دارد که مهمترین آنها عبارتند از:
- سازمان ها: این نوع گراف دانش به کاربران کمک می کند تا اطلاعات کلی درباره یک شرکت بدست آورند. برای مثال، اطلاعاتی از قبیل ارزش سهام، مدیر عامل و سال تاسیس آن را به کاربران نمایش خواهد داد.
- سلبریتی ها: این نوع از گراف معمولاً یک بیوگرافی کامل از افراد تاثیرگذار را به کاربران نمایش می دهد. برای مثال، تاریخ تولد، ملیت و میزان ثروت فرد در این گارف نمایش داده خواهد شد.
- کسب و کارهای محلی: گراف دانش گوگل معمولاً بیشترین مزیت را برای کسب و کارهای محلی دارد. این گراف شامل، آدرس، تلفن، نظرات و رتبه های کاربران و ساعات کاری یک بیزنس محلی در این گراف قابل نمایش است.
- رسانه: گراف دانش مربوط به رسانه اطلاعات کافی درباره فیلم ها، سریال ها و برنامه های تلویزیونی را به کاربران نمایش می دهند.
- گراف محصولات غذایی: گراف دانش بهترین روش برای نمایش اطلاعات کاربردی ساده نظیر دستورهای آشپزی است. برای مثال، با جستجوی واژه کیک شکلاتی در گوگل می توان اطلاعات مربوط به مواد به کار رفته در آن را به طور خلاصه مشاهده کنید.
سخن پایانی
گوگل همواره تلاش می کند تا در کوتاه ترین زمان ممکن کاربران را به مطالب مورد نظرشان برساند. ابزار گراف دانش گوگل با گردآوری داده های مربوط به یک Topic سعی می کند تا اطلاعات دقیق و کاملی را به صورت خلاصه به کاربران نمایش دهد. گراف دانش معمولاً این اطلاعات را از منابع آزاد نظیر ویکی پدیا تهیه می کند، بنابراین ممکن است در برخی اوقات دچار اشتباه شود. بد نیست بدانید که شما به عنوان کاربر می توانید گراف دانش گوگل را اصلاح کنید. برای این کار کافیست که بر روی گزینه Feedback کلیک کرده و به گوگل برای اصلاح اطلاعات غلط خبر دهید.
دیدگاهتان را بنویسید
برای نوشتن دیدگاه باید وارد بشوید.