Thứ Tư, 6 tháng 2, 2013

Nofollow - Cách thức sử dụng Nofollow

1. Giới thiệu tổng quan về Nofollow:

nofollow là một giá trị thuộc tính HTML được dùng để yêu cầu một số bộ máy tìm kiếm rằng một siêu liên kết không nên ảnh hưởng đến xếp hạng liên kết đến trang đích trong chỉ mục của bộ máy tìm kiếm. Nó được tạo dựng nhằm giảm tác động của một số loại spam bộ máy tìm kiếm, nhờ vậy làm tăng chất lượng của kết quả tìm kiếm do máy tìm kiếm trả về và giảm hiện tượng spamdexing.

Mục lục

Ý niệm và bản mô tả kỹ thuật

Ý niệm tạo ra bản mô tả kỹ thuật của giá trị thuộc tính nofollow do người đứng đầu nhóm webspam của GoogleMatt Cutts và Jason Shellen của trang Blogger.com nghĩ ra vào năm 2005[1].
Bản mô tả kỹ thuật của nofollow được các tác giả bảo hộ bản quyền từ giai đoạn 2005-2007 và là đối tượng của quy định sáng chế miễn phí bản quyền, như tuân theo Quy định bằng sáng chế 20040205 của W3C[2], và IETF RFC 3667 & RFC 3668. Các các tác giả định gửi bản mô tả này đến các cơ quan tiêu chuẩn có quy định bản quyền/cấp phép phép bản quyền tự do như GMPG, IETF, và/hoặc W3C[1].

nofollow không phải là

Giá trị thuộc tính nofollow không có nghĩa là ngăn việc truy cập vào nội dung, hoặc khóa không cho nội dung được các bộ máy tìm kiếm lập chỉ mục. Các phương pháp thích hợp để khóa không cho nhện tìm kiếm truy cập nội dung trên một website hoặc để ngăn không cho chúng đưa nội dung trang vào chỉ mục là Robots Exclusion Standard (robots.txt) để cấm việc truy cập đến nội dung và các thành phần Meta được thiết kế để chỉ định theo cấp độ từng trang những thứ mà nhện tìm kiếm nên và không nên làm đối với nội dung của trang được dò.

Việc diễn dịch của từng bộ máy tìm kiếm

Trong khi tất cả các bộ máy hỗ trợ thuộc tính này đều loại trừ các liên kết có sử dụng loại thuộc tính này ra khỏi cách tính toán xếp hạng của họ, chi tiết về các diễn dịch chính xác thuộc tính này khác nhau giữa các trình duyệt[3][4].
  • Google nói rằng bộ máy của họ xem "nofollow" theo nghĩa thông thường và sự thực là hoàn toàn không "follow" (theo) liên kết. Tuy nhiên, các thử nghiệm do các trình SEO thực hiện cho thấy các kết quả trái ngược nhau. Các nghiên cứu này cho thấy Google có đi theo liên kết, nhưng không lập chỉ mục trang được liên kết đến, trừ khi nó đã nằm trong chỉ mục của Google vì các lý do khác rồi (ví dụ như các liên kết không dùng nofollow chỉ đến trang)[4][5].
  • Yahoo! "có đi theo", nhưng bỏ nó ra khỏi tính toán xếp hạng.
  • Bing xem "nofollow" là không đi theo liên kết[6].
  • Ask.com bỏ qua thuộc tính này.

Việc sử dụng nofollow của các phần mềm weblog

Đa số phần mềm weblog mặc định đánh dấu các liên kết do người dùng đăng lên theo cách này (không có tùy chọn tắt mà không phải điều chỉnh mã nguồn). Một phần mềm máy chủ tinh vi hơn có thể miễn nofollow cho các liên kết do các thành viên tin cậy đăng lên như những người đăng ký đã lâu, nằm trong danh sách trắng, hoặc có điểm tốt từ các thành viên khác. Một vài phần mềm máy chủ thêm rel="nofollow" vào các trang vừa được sửa đổi nhưng bỏ nó ra khỏi các trang ổn định, theo lý thuyết rằng các trang ổn định sẽ được những biên tập viên bỏ đi những liên kết xấu.
Nền tảng blog được sử dụng rộng rãi WordPress phiên bản 1.5 trở lên tự động thêm thuộc tính nofollow vào tất cả các liên kết do người dùng đăng lên (dữ liệu bình luận, URI của người bình luận, v.v.)[7]. Tuy nhiên, có một vài plugin miễn phí hiện có để tự động xóa các giá trị thuộc tính nofollow đi[8].

Việc sử dụng ở các website khác

Phần mềm MediaWiki, hiện đang chạy Wikipedia, được trang bị hỗ trợ nofollow một thời gian ngắn sau khi được công bố năm 2005. Tùy chọn này được bật tại hầu hết Wikipedia. Một trong những ngoại lệ đáng chú ý là Wikipedia tiếng Anh. Thoạt đầu, sau khi thảo luận, Wikipedia này quyết định không sử dụng rel="nofollow" trong bài viết mà sử dụng danh sách đen URL. Theo cách này, Wikipedia tiếng Anh đóng góp điểm số cho các trang mà nó liên kết tới, và kỳ vọng các thành viên sửa đổi sẽ liên kết đến các trang thích hợp.
Vào tháng 5 năm 2006, một bản vá cho phần mềm MediaWiki cho phép kích hoạt nofollow một cách tùy chọn trong không gian tên. Tính năng này được dùng trên các trang không được xem là một phần của bách khoa toàn thư thực sự, như các trang thảo luận và tài nguyên dành riêng cho biên tập viên[9]. Sau khi vấn đề spam ngày càng nhiều lên và với chỉ thị từ Quỹ của Jimmy Wales, rel="nofollow" đã được thêm vào các liên kết trong không gian bài viết vào tháng 1 năm 2007[10][11]. Tuy nhiên, nhiều tiêu bản liên wiki và các trang tắt liên kết đến các dự án khác của Wikimedia Foundation và nhiều wiki bên ngoài như Wikia không chịu ảnh hưởng của quy định này.
Các website đánh dấu trang xã hội và chia sẻ hình ảnh có sử dụng thẻ rel="nofollow" cho các liên kết ngoài của họ bao gồm YouTube; websites không sử dụng thẻ rel="nofollow" bao gồm Digg.com, Furl, Propeller.com (trước đây là Netscape.com), Yahoo! My Web 2.0, và Technorati Favs[12].


2. Tìm hiểu về nofollow

Trước tiên "Nofollow" là một thuộc tính xuất hiện trong thẻ <meta> trong trang. Nó chỉ dẫn cho công cụ tìm kiếm rằng không theo (không thu thập thông tin) bất cứ Link nào bên trong bài viết đó.

Ví dụ:

Thuộc tính "nofollow" được sử dụng trên các Link cá nhân, ngăn chặn các Robots theo các liên kết tới Website khác.

Ví Dụ:

Chuyển hướng đường dẫn tới 1 URL bị chặn trên Robots.txt. Đó là lý do "Nofollow" được tạo ra là một thuộc tính của thẻ "rel".

Ngoài ra, không nhất thiết phải đặt "nofollow" cho tất cả các Link có trên website, mà chúng ta có thể tùy biến lựa chọn đặt thuộc tính trên cho bất ký một Link cụ thể nào trong trang:

<a title="Công ty thiết kế website" href= rel="nofollow">Công ty thiết kế website</a>

Vậy câu hỏi đặt ra là Google sẽ xử lý các Link Nofollow như thế nào?

Nói chung rằng, khi đặt thuộc tính "Nofollow" cho bất kỳ 1 Link nào, có thể nói với Google rằng "chúng tôi không theo họ"; điều này có nghĩa là Google sẽ không chuyển 1 phần nào PR hay Value Web sang website đó hết.

Tuy nhiên, các trang mục tiêu vẫn có thể được Google Bot thu thập và lập chỉ mục nếu:

* Các trang Web trỏ tới họ không sử dụng "Nofollow"

* Các Link đó nằm trong File sitemap.xml gửi tới Google.

Nếu bạn tham gia diễn đàn hay các mạng xã hội và tạo liên kết tới các Profile của mình thì Google khuyên chúng ta nên sử dụng rel="me nofollow".

Một điều chú ý cuối cùng nữa là mỗi một công cụ tìm kiếm khác nhau sẽ có cách xử lý thông tin "Nofollow" khác nhau!

3.Thủ thuật SEO - Bạn cần biết rel="nofollow" cho các liên kết

Đặt giá trị thuộc tính "rel" của liên kết thành "nofollow" sẽ cho Google biết rằng không nên đi theo một số liên kết nhất định trên trang web của bạn hoặc không nên đưa danh tiếng trang của bạn đến những trang được liên kết tới. Không đi theo liên kết là thêm rel="nofollow" vào trong thẻ liên kết của liên kết đó.



Nếu bạn liên kết đến trang web mà bạn không tin cậy và không muốn chuyển danh tiếng trang web của bạn sang đó, sử dụng thuộc tính nofollow 


Khi nào điều này sẽ hữu ích? Nếu trang web của bạn có blog bật chế độ nhận xét công cộng, các liên kết trong các nhận xét đó có thể chuyển danh tiếng của bạn tới các trang mà bạn có thể không yên tâm bảo đảm cho chúng. Khu vực nhận xét của blog trên các trang là khu vực có khả năng bị spam nhận xét rất cao. Không đi theo các liên kết được thêm bởi người dùng này đảm bảo rằng bạn không đưa danh tiếng mà bạn mất công gây dựng cho trang của mình cho các trang web spam. Nhiều gói phần mềm tạo blog tự động không đi theo các nhận xét của người dùng nhưng các phần mềm không có tính năng đó hầu hết đều có thể được chỉnh sửa bằng tay để thực hiện điều này. Lời khuyên này cũng dành cho các khu vực khác liên quan đến nội dung do người dùng tạo trong trang web của bạn, như sổ dành cho khách, diễn đàn, bảng ý kiến, danh sách tham chiếu v.v.... Nếu bạn sẵn lòng đảm bảo cho các liên kết được thêm bởi bên thứ ba (ví dụ: nếu người nhận xét được tin cậy trên trang web của bạn) thì bạn không cần phải sử dụng thuộc tính nofollow cho các liên kết; tuy nhiên, việc liên kết đến các trang web mà Google xem là spam có thể ảnh hưởng đến danh tiếng của chính trang web của bạn. Trung tâm Trợ giúp Quản trị Trang web có thêm các mẹo khác về tránh spam nhận xét, như việc sử dụng các CAPTCHA và bật kiểm duyệt nhận xét.

Người gửi spam nhận xét để lại thông điệp trên một trong những bài đăng mới của chúng tôi, hy vọng lấy được phần nào danh tiếng của chúng tôi

Trường hợp khác sử dụng thuộc tính nofollow là khi bạn đang viết nội dung và muốn tham chiếu trang web nhưng không muốn chuyển danh tiếng của mình sang cho trang web này. Ví dụ: hãy tưởng tượng rằng bạn đang viết bài đăng trên blog về chủ đề spam nhận xét và bạn muốn chỉ ra trang web gần đây đã spam nhận xét trên blog của bạn. Bạn muốn cảnh báo những người khác về trang web này, vì vậy bạn đưa liên kết đến trang web đó vào nội dung của mình; tuy nhiên bạn chắc chắn không muốn trao cho trang web này phần nào danh tiếng của mình từ liên kết của bạn. Đây chính là lúc sử dụng thuộc tính nofollow.
Cuối cùng, nếu bạn muốn không đi theo tất cả các liên kết trên trang, bạn có thể sử dụng "nofollow" trong thẻ meta của các robot của bạn được đặt bên trong thẻ head của HTML trang đó. Blog Trung tâm Quản trị Trang web cung cấp bài đăng hữu ích về sử dụng thẻ meta của robot. Phương thức này được viết là: meta name="robots" content="nofollow"

Làm như trên sẽ đặt thuộc tính nofollow cho tất cả các liên kết trên trang



4. rel="nofollow" (Google Support)

"Nofollow" provides a way for webmasters to tell search engines "Don't follow links on this page" or "Don't follow this specific link."
Originally, the nofollow attribute appeared in the page-level meta tag, and instructed search engines not to follow (i.e., crawl) any outgoing links on the page. For example:
 <meta name="robots" content="nofollow" />
Before nofollow was used on individual links, preventing robots from following individual links on a page required a great deal of effort (for example, redirecting the link to a URL blocked in robots.txt). That's why the nofollow attribute value of the rel attribute was created. This gives webmasters more granular control: instead of telling search engines and bots not to follow any links on the page, it lets you easily instruct robots not to crawl a specific link. For example:
 <a href="signin.php" rel="nofollow">sign in</a>

How does Google handle nofollowed links?

In general, we don't follow them. This means that Google does not transfer PageRank or anchor text across these links. Essentially, using nofollow causes us to drop the target links from our overall graph of the web. However, the target pages may still appear in our index if other sites link to them without using nofollow, or if the URLs are submitted to Google in a Sitemap. Also, it's important to note that other search engines may handle nofollow in slightly different ways.

What are Google's policies and some specific examples of nofollow usage?

Here are some cases in which you might want to consider using nofollow:
  • Untrusted content: If you can't or don't want to vouch for the content of pages you link to from your site — for example, untrusted user comments or guestbook entries — you should nofollow those links. This can discourage spammers from targeting your site, and will help keep your site from inadvertently passing PageRank to bad neighborhoods on the web. In particular, comment spammers may decide not to target a specific content management system or blog service if they can see that untrusted links in that service are nofollowed. If you want to recognize and reward trustworthy contributors, you could decide to automatically or manually remove the nofollow attribute on links posted by members or users who have consistently made high-quality contributions over time.
  • Paid links: A site's ranking in Google search results is partly based on analysis of those sites that link to it. In order to prevent paid links from influencing search results and negatively impacting users, we urge webmasters use nofollow on such links. Search engine guidelines require machine-readable disclosure of paid links in the same way that consumers online and offline appreciate disclosure of paid relationships (for example, a full-page newspaper ad may be headed by the word "Advertisement"). More information on Google's stance on paid links.
  • Crawl prioritization: Search engine robots can't sign in or register as a member on your forum, so there's no reason to invite Googlebot to follow "register here" or "sign in" links. Using nofollow on these links enables Googlebot to crawl other pages you'd prefer to see in Google's index. However, a solid information architecture — intuitive navigation, user- and search-engine-friendly URLs, and so on — is likely to be a far more productive use of resources than focusing on crawl prioritization via nofollowed links.

How does nofollow work with the Social Graph API (rel="nofollow me")?

If you host user profiles and allow users to link to other profiles on the web, we encourage you to mark those links with the rel="me" microformat so that they can be made available through the Social Graph API. For example:
<a href="http://blog.example.com" rel="me">My blog</a>
However, because these links are user-generated and may sometimes point to untrusted pages, we recommend that these links be marked with nofollow. For example:
<a href="http://blog.example.com" rel="me nofollow">My blog</a>
With rel="me nofollow", Google will continue to treat the rel="nofollow" as expected for search purposes, such as not transferring PageRank. However, for the Social Graph API, we will count the rel="me" link even when included with a nofollow.
If you are able to verify ownership of a link using an identity technology such as OpenID or OAuth, however, you may choose to remove the nofollow link.
To prevent crawling of a rel="me nofollow" URL, you can use robots.txt. Standard robots.txt exclusion rules are respected by both Googlebot and the Social Graph API.
updated 12/03/2012

1 nhận xét:

  1. Bài viết rất hay, cảm cơn bạn. Trang web của mình là về dịch thuật. Bạn có thể xem cho mình trong trang web của mình những chỗ nào cần đặt nofollow nhé. mình ko phải là dân trong nghề nên ko biết đc nhiều. mong bạn "chỉ giáo".
    Website: www.dichtot.vn

    Trả lờiXóa