Canonical URL là gì? Cách sử dụng và tối ưu Canonical URL cho website

Canonical URL là một thuật ngữ có lẽ không mấy xa lạ đối với các bạn đang tìm hiểu cũng như những công việc liên quan tới website, SEO,… Thế nhưng liệu bạn đã hiểu rõ về Canonical URL là gì cũng như làm thế nào để sử dụng và tối ưu Canonical URL cho website chưa? Cùng tìm hiểu qua bài viết sau đây nhé!

Tìm hiểu về Canonical Url

Canonical Url là gì?

Canonical URL thường được biết đến với tên gọi Rel Canonical. Đây là thành phần HTML có nhiệm vụ khai báo URL gốc của trang đang bị trùng lặp nội dung với công cụ tìm kiếm. Người ta thường sử dụng thẻ Canonical nhiều nhất trong trường hợp nội dung bị duplicate hoặc quá giống nhau trên nhiều URL.

Tìm hiểu về Canonical Url
Tìm hiểu về Canonical Url

Nếu không chỉ rõ đâu là link gốc, thì Google hoặc các công cụ tìm kiếm khác sẽ thay bạn chọn URL chuẩn trong số trang bị trùng lập. Hoặc chúng có thể ngầm hiểu các trang này có tầm quan trọng như nhau. Tuy nhiên, cả hai điều này đều không có lợi cho website của bạn.

Phân biệt với điều hướng 301

Rất nhiều người vẫn thường bị lẫn lộn giữa Canonical URL và Điều hướng 301. Để hiểu rõ hơn, chúng ta hãy cùng tìm hiểu thật kỹ sự khác nhau giữa hai thuật ngữ này.

Điều hướng 301 có khả năng chuyển người dùng lập tức từ trang A sang một trang B miễn là trang B có link truy cập khác. Và ngay trong lúc dịch chuyển đó, nó sẽ thông báo cho các công cụ tìm kiếm rằng URL của trang A đã không còn ở đây nữa và điều hướng đã chuyển sang một URL B mới. SE sau khi nhận được tin sẽ dừng lập chỉ ở URL A và chuyển tất cả ảnh hướng sang URL B.

Phân biệt với điều hướng 301
Phân biệt với điều hướng 301

Ngược lại, Canonical URL sẽ không hoạt động như thế. Nó sẽ không chuyển người dùng sang một trang mới mà chỉ thông báo ngầm cho SE biết đâu là URL chuẩn nhất trong các trang bị trùng lặp. Do đó, người dùng không thể biết về hoạt động của Canonical URL trừ khi xem lại mã code.

Những trường hợp trùng lặp

Thông thường, sẽ có 7 dạng trùng lặp mà website của bạn thường hay gặp phải. Bao gồm:

  • Tên miền phụ và giao thức
  • Có hoặc không dấu gạch chéo cuối link
  • Phiên bản dành cho di động
  • Bộ lọc và sắp xếp
  • Trang tìm kiếm nội bộ
  • Trang đích trỏ tới 1 trang liên kết
  • Trùng lặp chéo giữa các tên miền
Những trường hợp trùng lặp
Những trường hợp trùng lặp

Tên miền phụ và giao thức: Trường hợp trùng lặp thường hay gặp nhất là tên miền phụ (www.) và giao thức (https). Chúng ta dễ dàng tìm thấy những website có ít nhất 4 URL có cùng nội dung và bị xem là trùng lặp. Ví dụ như:

  • http://thegioididong.com
  • https://thegioididong.com
  • http://www.thegioididong.com
  • https://www.thegioididong.com

Có hoặc không dấu gạch chéo cuối link: Tình huống hay gặp tiếp theo là hai URL bị trùng lặp do khác nhau ở dấu gạch chéo cuối cùng. Thậm chí có những website có cả hai phương án là có gạch và không gạch, nhưng cuối cùng vẫn cho ra một trang duy nhất (trùng lặp).

Phiên bản dành cho di động: Khi chúng ta sử dụng điện thoại, URL có thể có tận 2 phiên bản riêng cho cùng một trang web. Tuy nhiên, trong source code của trang web đó sẽ chỉ ra đâu là URL chuẩn xác nhất.

Bộ lọc và sắp xếp: Sự trùng lặp đôi khi cũng bị gây ra bởi các yếu tố từ việc sử dụng công cụ bộ lọc và sắp xếp. Để giải thích một cách đơn giản thì lí do là vì những tác vụ này tạo ra các URL khác nhau nhưng nội dung thì không hề thay đổi.

Những lỗi trùng lặp URL thường hay gặp

Những lỗi trùng lặp URL thường hay gặp

Trang tìm kiếm nội bộ: Khi vào một trang web, ta thường để ý thấy có một mục là tìm kiếm trong trang. Nhưng đôi khi ở cùng một trang, ta tìm kiếm những từ khóa khác nhau thì cho URL khác nhau. Đó cũng được xem là sự trùng lặp.

Trang đích trỏ tới 1 trang liên kết: Khi đi tiếp thị liên kết, chúng ta thường có thói quen đặt link trang của mình dẫn đến trang đích. Một khi nhấn chuột vào đường dẫn đó, nó sẽ đưa ta đến trang đích kèm theo tham số giới thiệu. Theo đúng bản chất mà nói, đây vẫn là trang cũ, chỉ khác là URL được thay đổi. Đó cũng là lỗi trùng lặp.

Trùng lặp chéo giữa các tên miền: Khi bạn đang có hai hay nhiều trang web mang tên miền khác nhau nhưng nội dung lại hoàn toàn giống nhau thì đây cũng là một lỗi trùng lặp đó. Một mẹo khi gặp lỗi này là hãy tìm ra URL chuẩn và chỉ rõ những trang còn lại là bản sao và cần phải hướng về trang chuẩn đó.

Lợi ích Canonical Url cho website

  • Thẻ Canonical được sinh ra để giải quyết vấn đề Duplicate Content – trùng lặp nội dung trên website của bạn.
  • Chỉ rõ cho Google biết cần index và xếp hạng phiên bản nào của trang.
  • Giảm thiểu thời gian Google thu thập thông tin trang web của bạn.
  • Giúp website của bạn trở nên thân thiện hơn với các SE, góp phần tối ưu hóa trang web.

Cách sử dụng thẻ Canonical

Năm quy tắc khi sử dụng

Năm quy tắc khi sử dụng
Năm quy tắc khi sử dụng
  • Quy tắc 1: Sử dụng URL tuyệt đối

Sau một quá trình nghiên cứu, Google đưa ra lời khuyên cho người dùng rằng cách tốt nhất là không dùng đường dẫn tương đối với phần tử rel=“canonical”.

  • Quy tắc 2: Sử dụng chữ viết thường trong URL

Dựa trên các thuật toán đã được lập trình sẵn, các công cụ tìm kiếm thường tự mặc định và coi các URL viết hoa và viết thường là hai link hoàn toàn khác nhau. Người dùng được khuyên là nên sử dụng chữ viết thường trong URL trên máy chủ của mình, và đồng thời sau đó tiếp tục dùng link viết thường cho Canonical Tag.

  • Quy tắc 3: Sử dụng đúng phiên bản miền HTTPS hay HTTP

Sử dụng đúng tên miền cũng là một nguyên tắc quan trọng khi sử dụng Canonical URL. Trong trường hợp đã chuyển sang SSL, bạn phải chắc chắn rằng không có bất kỳ URL nào được khai báo mà không phải SSL (tức là HTTP) trong khi sử dụng thẻ Canonical Tag.

  • Quy tắc 4: Sử dụng Canonical Tag tự tham chiếu

Theo các chuyên gia từ Google, Canonical tự tham chiếu là một sự lựa chọn đáng để suy nghĩ và cân nhắc. Vì với nó, bạn giúp Google trong việc thu thập thông tin và hiểu rõ trang cần index hoặc link sẽ có cấu trúc như thế nào khi được index. Nói một cách đơn giản, tự tham chiếu là thẻ Canonical được sử dụng trên một trang mà trỏ link đến chính nó.

  • Quy tắc 5: Sử dụng một Canonical Tag cho mỗi trang

Đôi khi không phải cái gì nhiều cũng là tốt, và điều này rất đúng với thẻ Canonical URL. Nếu một trang có nhiều hơn một thẻ Canonical Tag, Google sẽ bỏ qua tất cả. Vì thế, mỗi trang tốt nhất chỉ nên sử dụng một thẻ mà thôi.

Cách triển khai

Các bước triển khai Canonical
Các bước triển khai Canonical

Sử dụng HTML rel = “canonical”

Sau nhiều lần được áp dụng, rất nhiều người cho rằng dùng thẻ “rel = canonical” là cách dễ làm và dễ thấy nhất để chỉ định ra link gốc. Việc mà bạn cần làm là chỉ cần thêm mã sau vào phần <head> của bất kỳ trang trùng lặp nào.

Cài đặt thẻ Canonical trên các dòng tiêu đề HTTP

Mỗi loại website sẽ có một đặc điểm khác nhau. Ví dụ như đối với các tài liệu PDF, tuyệt nhiên không có phương pháp nào để áp dụng thẻ Canonical trong tiêu đề vì ở đây không có phần trang <head>. Trong những tình huống tương tự, hãy dùng dòng tiêu đề HTTP để đặt cho thẻ.

Cài đặt thẻ Canonical trong Sitemaps

Google là công cụ tìm kiếm được cài đặt những thuật toán vô cùng kỹ lưỡng. Google cho rằng những trang không có Canonical Tag chuẩn thì nhất định không được hiện diện trong sitemaps. Nguyên nhân là vì Google chỉ xem những trang được liệt kê trong sitemap là các URL gốc được đề xuất. Tuy nhiên, cũng có trường hợp họ từ chối chọn URL trong sitemaps làm link gốc.

Cài đặt thẻ Canonical trong Sitemaps
Cài đặt thẻ Canonical trong Sitemaps
  • Cài đặt thẻ Canonical với Điều hướng 301

Sử dụng Điều hướng 301 cũng là một cách hay để bạn có thể chuyển hướng lưu lượng truy cập ra khỏi URL trùng lặp và tới URL gốc. Thao tác ngắn gọn và đơn giản như sau quyết định một URL làm gốc và tiếp tục chuyển hướng cho link khác đến URL gốc đó.

  • Cài đặt thẻ Canonical với các liên kết nội bộ

Bạn hiểu thế nào là các liên kết nội bộ? Chúng là những liên kết chi tiết bên trong một trang web. Khi bạn trỏ link từ trang này chuyển sang trang khác trên toàn web của mình cũng được xem là một cách Canonical URL.

Cách tối ưu hóa Canonical Url

Để tối ưu hóa URL, bạn cần chọn một trang chuẩn (trang đích) và đặt thẻ <head> trong dòng mã chính sau đây:

<link rel=”canonical” href=”/url-chuan/” />

Trên đây là bài viết chi tiết về khái niệm thẻ Canonical URL, cách sử dụng và làm thế nào để tối ưu nó. Hy vọng thông qua bài viết bạn đã có cho mình những kiến thức bổ ích. Đừng quên chia sẻ bài viết với bạn bè nếu bạn thấy hay và bổ ích nhé!

Leave a Reply

Your email address will not be published. Required fields are marked *