Trang chủ / SEO / Kiểm soát cách Google chỉ mục trang web của bạn bằng thẻ meta
seo thẻ meta

Kiểm soát cách Google chỉ mục trang web của bạn bằng thẻ meta

Hiện nay trên thế giới có rất nhiều công cụ tìm kiếm như Bing, Yahoo, Yandex hay Cốc Cốc tại Việt Nam nhưng khi làm SEO đa phần chúng ta đều chủ tập trung vào công cụ tìm kiếm lớn nhất thế giới hiện nay – Google. Hôm nay mình sẽ hướng dẫn các bạn kiểm soát cách mà Google lập chỉ mục website của bạn bằng thẻ meta để giúp website của các bạn có thứ hạng cao hơn trên Google.

Thẻ meta robot hiện nay được rất nhiều công cụ tìm kiếm như Google, Bing, Yahoo sử dụng làm công cụ giao tiếp với các website. Đối với các lập trình viên, thẻ meta được sử dụng để kiểm soát khả năng truy cập đối với một trang web. Ví dụ như noindex sẽ ngăn chặn tất cả các con bot từ các công cụ tìm kiếm khỏi việc lập chỉ mục dữ liệu trang web đó. Google có một con bot gọi là Googlebot. Sau đây mình sẽ chỉ cho các bạn những cách để kiếm soát con Googlebot này :D

Nên xem: 5 thứ hay ho bạn có thể làm với thẻ Meta của html

Chỉ chặn riêng Googlebot

Để chỉ chặn riêng Googlebot không lập chỉ mục dữ liệu trang web, bạn hãy thay thế  robots thành googlebot. Trong ví dụ sau:

<meta name="googlebot" content="noindex">

Đoạn mã này khi chèn vào trong website thì nó sẽ chỉ chặn riêng Googlebot không index trang web của bạn nhưng các con bot của Bing, Yahoo vẫn có thể. Nếu bạn muốn chặn tất cả các con bot chỉ việc thay googlebot bằng robots. Tương tự nếu bạn muốn chặn Bing thì là Bingbot còn Yahoo bot của nó tên là gì thì mình không biết :D Riêng Google hơi đặc biệt xíu là nó có rất nhiều con bot khác nhau nào là bot ảnh, tin tức, video, ads, mobile và Google cho phép chúng ta chặn riêng những con này. Ở đây bạn chỉ cần dùng đến con bot mobile. Chẳng hạn, nếu bạn muốn trang web mình xuất hiện trên Google khi người dùng tìm kiếm bằng máy tính nhưng không muốn xuất hiện khi tìm kiếm trên di động thì bạn có thể sử dụng thẻ meta sau:

<meta name="googlebot-mobile" content="noindex">

Danh sách đầy đủ các loại Googlebot và tên của nó bạn có thể xem tại đây

Ngăn chặn lập chỉ mục dữ liệu cho ảnh

Chắc hẳn bạn sẽ rất là khó chịu khi mà những bức ảnh bản quyền của bạn được đăng công khai trên Google và được tất cả mọi người dùng “chùa”. Do đó, nếu bạn vẫn muốn Google index nội dung trang web nhưng không index các bức ảnh thì bạn có thể thực hiện dễ dàng thông qua thẻ meta sau:

<meta name="googlebot" content="noimageindex">

Khi này các bài viết của bạn vẫn xuất hiện trên trang tìn kiếm Google nhưng sẽ không xuất hiện khi người dùng tìm kiếm trên Google Images. Ngoài cách trên bạn cũng có thể sử dụng con Googlebot Image mà mình nói ở trên và đặt noindex cho nó

<meta name="googlebot-image" content="noimageindex">

Ngăn chặn việc dịch trang web

Trình duyệt Google Chrome cung cấp tính nặng dịch nội dung trang web sang một ngôn ngữ khác tuỳ theo địa lí của người dùng thông qua sự trợ giúp của Google Translate. Tuy nhiên, hiện nay nó chưa được thông minh lắm, câu chữ còn rất khó hiểu và khi dịch nó sẽ biển thị trên Google khi người dùng tìm kiếm bằng một ngôn ngữ khác cho nên trong khi chờ nó tốt hơn bạn có thể tạm thời vô hiệu hoá việc tự động dịch nội dung trang web thông qua thẻ meta

<meta name="googlebot" content="notranslate">

Hoặc nếu bạn chỉ muốn ngăn chặn Google dịch một đoạn nhất định nào đó trên trang web thì có thể đặt nội dung đó trong cặp thẻ sau

<div class="notranslate">
<!-- the content -->
</div>

Không cho phép Google chỉ mục dữ liệu sau một thời gian nhất định

Đây là một tính năng khá là hay giúp bạn kiểm soát việc lập chỉ mục của Google. Việc này hữu ích nếu website của các bạn thuộc các dạng như khuyến mại, sự kiện,…chỉ tồn tại trong một thời gian nhất định Khi đó, bạn cần nói với con bot của Google rằng chỉ lập chỉ mục trang này trong một thời gian nhất định, ví dụ sự kiện, sau khi sự kiện kết thúc không chỉ mục trang này nữa. Để làm được điều này, bạn chỉ cần sử dụng thuộc tính unavailable_after trong thẻ meta sau đó thêm thời gian vào, bạn cần đặt thời gian theo chuẩn RFC-850, ví dụ Thursday, 20-Aug-15 10:00:00 UTC

<meta name="googlebot" content="unavailable_after: Monday, 29-Sep-15 10:00:00 UTC">

Với ví dụ trên, Google sẽ không truy cập và lập chỉ mục dữ liệu trang web sau ngày 29 Tháng Tám, 2015. Ngay sau khi qua thời gian này không những Google không chỉ mục nữa mà trang web của bạn cũng biến mất khỏi Google luôn và bạn không cần thiết phải xoá trang đó đi mà có thể dùng để lưu trữ.

Hi vọng qua bài viết này, bạn đã biết được những cách để kiếm soát hoạt động của con Googlebot để trở thành những SEOers thông minh :D, có khó khăn gì hãy bình luận bên dưới cho mình biết nhé.

Chúc các bạn thành công!

Nếu bạn thấy có ích, hãy subcribe blog của tôi để nhận thêm nhiều tút hay qua email nữa nhé!