1. Cơ chế hoạt động của công cụ tìm kiếm
Một sự thật cơ bản đầu tiên mà bạn cần biết đó là công cụ tìm kiếm của Google không phải là con người. Chính vì thế sẽ có sự khác nhau giữa con người và công cụ tìm kiếm trong việc đánh giá nội dung của một trang web. Mặc dù công cụ tìm kiếm được trang bị các công nghệ rất hiện đại tuy nhiên nó vẫn không đủ thông minh để có thể cảm nhận được vẻ đẹp của một mẫu thiết kế, thưởng thức âm thanh hoặc thấy được chuyển động của một video nào đó.
Vì vậy khi công cụ tìm kiếm thu thập dữ liệu của trang web nó chỉ nhìn vào các văn bản cụ thể để cố gắng hiểu được trang web này đang muốn nói về vấn đề gì.
Công Cụ Tìm Kiếm Gồm 3 Bộ Phận Chính:
Robot (Google Bot) – Bộ thu thập thông tin
Robot được biết đến dưới nhiều tên gọi khác nhau: spider, bot, crawler, hoặc web worm… về bản chất robot chỉ là một chương trình duyệt và thu thập thông tin từ các website trên mạng, nó tự động duyệt qua các cấu trúc siêu liên kết và trả về các danh mục kết quả của công cụ tìm kiếm. Robot thường được ví với hình ảnh con nhện vì nó tự động di chuyển trên internet thông qua các liên kết và internet chính là mạng nhện của nó.
Index – Bộ Phận Lập Chỉ Mục
Hệ thống lập chỉ mục trong các công cụ tìm kiếm thực hiện việc phân tích, chọn lựa và lưu trữ những thông tin cần thiết (thông qua các từ khoá hay cụm từ khoá) một cách nhanh chóng và chính xác từ những dữ liệu mà Robot thu được.
Bộ Phận Xử Lí –Tính Toán
Đây là quá trình tính toán của Google nhằm cung cấp các kết quả cho người tìm kiếm. Theo thống kê, Google sử dụng hơn 200 yếu tố để xếp hạng trang web. Các yếu tố này có tầm quan trọng khác nhau, tuy nhiên một trong những yếu tố quan trọng nhất để xếp hạng đó là dựa trên chất lượng nội dung và chất lượng của những liên kết đến trang web của bạn.
Cơ Chế Hoạt Động Của Google Spider
– Đầu tiên Google Spider sẽ lấy danh sách các máy chủ và trang web phổ biến. Sau đó nó sẽ bắt đầu tìm kiếm với một site bất kỳ, nó đánh chỉ mục các từ khóa trên trang và theo các liên kết (link) tìm thấy bên trong trang web này. Khi Spider xem xét các trang web (định dạng HTML), nó lưu ý: Các từ bên trong trang web & nơi nó tìm thấy các từ đó.
Ví dụ: Các từ xuất hiện trong các thẻ tiêu đề, thẻ miêu tả…. nó nhận định đây là phần quan trọng có liên quan đến sự tìm kiếm của người dùng sau này. Vì thế đối với mỗi website Google nó sẽ có nhiều phương pháp để index lại chỉ mục, liệt kê lại các từ khóa chính. Nhưng dù dùng cách nào thì Google cũng luôn cố gắng làm cho hệ thống tìm kiếm diễn ra nhanh hơn để người dùng có thể tìm kiếm hiệu quả hơn hoặc cả hai.
– Kế đó Google sẽ xây dựng chỉ mục: Xây dựng chỉ mục sẽ giúp cho các thông tin được tìm thấy một cách nhanh chóng. Sau khi tìm thông tin trên trang web, Google Spider nhận ra rằng việc tìm kếm thông tin trên website là một quá trình không bao giờ kết thúc… bởi vì các quản trị trang web luôn thay đổi thông tin, cập nhật thông tin trên website và điều đó có nghĩa rằng Spider sẽ luôn phải thực hiện nhiệm vụ thu thập dữ liệu.
Giả sử website của bạn làm về ngành du lịch… nó sẽ lưu các chỉ mục trên website của bạn vào ngành du lịch… Nếu site bạn làm về ca nhạc, nó sẽ lưu các chỉ mục trên web bạn vào ngành ca nhạc.
– Xử lý và tính toán: Sau khi lập chỉ mục Google sẽ xử lý, tính toán và mã hóa thông tin để lưu trữ trong cơ sở dữ liệu. Và khi có một truy vấn tìm kiếm thì hệ thống sẽ trả về các kết quả có chứa nội dung hữu ích tương ứng với các truy vấn tìm kiếm của người dùng.
==> Việc hiểu rõ cơ chế tìm kiếm của Google sẽ giúp cho các Seoer thêm nhiều kỹ năng để có thể tối ưu website thân thiện với Google nhằm mục đích đưa trang web có thứ hạng cao hơn.