Mẹo tránh trùng lặp nội dung khi chuyển hướng sang giao thức HTTPS

Cần rất cẩn thận để không ảnh hưởng đến hiệu quả SEO

Cài đặt chứng thư SSL lên máy chủ thực sự không phải là quá khó. Tuy nhiên, bạn cần lưu ý khi chuyển hướng website của mình sang giao thức HTTPS nếu không muốn Google tưởng nhầm bạn có hai trang web với cùng một nội dung, mặc dù bằng mắt thường chúng ta đều thấy rằng https://vidu.com và http://vidu.com là một.

 

Tránh để Google hiểu nhầm hai trang web cùng 1 nội dung

Trước tiên bạn cần sử dụng Redirect 301 để chuyển hướng tất cả các trang HTTP sang HTTPS. Chúng tôi khuyến nghị bạn sử dụng kích hoạt SSL đối với tất cả các trang của website và không nên để người duyệt web di chuyển liên tục giữa 2 giao thức HTTP và HTTPS. Điều đó không chỉ tiêu tốn tài nguyên của máy chủ khi liên tục phải thực hiện công tác bắt tay (handshaking) mà còn tạo ra các tiết diện để tin tặc khai thác website của bạn (attack surface).

 

Đối thủ khai thác lỗi cấu hình của bạn

Một số máy chủ hiện nay vẫn chạy giao thức HTTPS mà không cần có chứng thư SSL, hoặc không hiển thị trang web nếu không có SSL hoặc không được chuyển hướng. Như đề cập, Google phân biệt https và http, vì vậy, nếu đối thủ của bạn khai thác lỗ hổng này và liên kết đến trang HTTP của bạn bằng cách sử dụng giao thức HTTPS, Google sẽ lập chỉ mục nội dung của bạn bị trùng lặp hoặc hiển thị cảnh bảo lỗi “Site can’t be reached”.

 

Có hoặc không có WWW

Một vấn đề tương tự với Google là nó sẽ phân biệt https://vidu.com và https://www.vidu.com là hai trang web khác nhau, vì vậy để tránh lỗi này, bạn hãy chọn một và trỏ cái còn lại về cái đã chọn.

 

Một số mẹo để tránh lỗi trùng lặp nội dung

Sau đây là một số mẹo:

Canonical Tags – Kể cả khi đã chuyển hướng, hãy đánh dấu trang mặc định với tag canonical để Google hiểu trang nào cần hiển thị trong kết quả tìm kiếm.

Kiểm tra máy chủ – Kiểm tra máy chủ phản ứng thế nào đối với các link có và không có HTTPS để bổ sung redirect 301 nếu cần.

Rà soát các URL – Sử dụng các công cụ miễn phí và thương mại để kiểm thử các URL nhằm tránh lỗi trùng lặp nội dung.

Tìm lỗi 404s – Sử dụng Google Search Console để tìm kiếm và khắc phục các lỗi 404.

Sử dụng SSL – Mọi URL nên gán với giao thức HTTPS. Nếu URL của bạn thiết kế theo dạng thư mục thì bạn chỉ cần cấu hình các URL. Trong trường hợp bạn có nhiều tên miền phụ theo tên miền chính, hãy sử dụng lựa chọn bổ sung SAN hoặc Wildcard để bảo mật tất cả.

 

Hy vọng các thông tin và mẹo trên đây hữu ích với bạn!