- Phân loại các loại công cụ tìm kiếm trên Internet
- 1- Người tìm kiếm thứ bậc (Nhện)
- Trượt
- Đã lập chỉ mục
- Tính toán mức độ liên quan
- Lấy kết quả
- 2- Thư mục
- 3- Công cụ tìm kiếm kết hợp
- 4- Động cơ Metasearch
- Người giới thiệu
Việc phân loại công cụ tìm kiếm trên internet có thể được chia thành công cụ tìm kiếm phân cấp, thư mục, công cụ tìm kiếm kết hợp và công cụ tìm kiếm meta.
Công cụ tìm kiếm là một hệ thống phần mềm được thiết kế để tìm kiếm thông tin trên World Wide Web. Họ sử dụng các từ khóa để tìm kiếm các tài liệu có liên quan đến các từ đó và sau đó xếp hạng kết quả theo thứ tự phù hợp với chủ đề đang tìm kiếm.
Các công cụ tìm kiếm trên Internet tìm cách trích xuất thông tin mà người dùng của họ yêu cầu; điều này có thể thực hiện được do một cơ sở dữ liệu lớn có sẵn trên internet.
Chúng đã trở thành một công cụ để sử dụng hàng ngày để tìm kiếm thông tin. Nhờ đó, hiện nay việc tìm kiếm thông tin bằng các công cụ tìm kiếm như Google, AOL, Yahoo và Bing là rất dễ dàng.
Có hàng ngàn công cụ tìm kiếm khác nhau có sẵn trên Internet; mỗi người có những khả năng và đặc điểm khác nhau.
Công cụ tìm kiếm đầu tiên được phát triển được gọi là Archie và nó được sử dụng để tìm kiếm các tệp FTP; công cụ tìm kiếm dựa trên văn bản đầu tiên được gọi là Veronica.
Người dùng có thể truy cập công cụ tìm kiếm thông qua trình duyệt trên máy tính, điện thoại thông minh, máy tính bảng hoặc bất kỳ thiết bị điện tử nào khác.
Phân loại các loại công cụ tìm kiếm trên Internet
1- Người tìm kiếm thứ bậc (Nhện)
Loại công cụ tìm kiếm này sử dụng 'con nhện' để tìm kiếm các trang web trên Internet. Con nhện này đi vào các trang web riêng lẻ, lấy ra các từ khóa, và sau đó thêm các trang vào cơ sở dữ liệu của công cụ tìm kiếm internet.
Ưu điểm của loại công cụ tìm kiếm này là chúng chứa một số lượng lớn các trang và chúng rất dễ sử dụng. Vì lý do này, người dùng thường tạo ra sự quen thuộc với nó và sử dụng nó nhiều lần.
Mặt khác, nhược điểm bao gồm vì chúng trích xuất quá nhiều dữ liệu, nên có thể có quá nhiều thông tin.
Hầu hết các công cụ tìm kiếm phổ biến trên Internet đều phân cấp, chẳng hạn như Google, Bing, Yahoo, Baidu và Yandex.
Tất cả các công cụ tìm kiếm Internet phân cấp đều sử dụng bot (con nhện) để tìm và lập chỉ mục nội dung mới vào cơ sở dữ liệu tìm kiếm.
Có bốn bước cơ bản mà mọi công cụ tìm kiếm phân cấp đều tuân theo trước khi hiển thị bất kỳ trang web nào trong kết quả tìm kiếm:
Trượt
Các công cụ tìm kiếm thu thập thông tin trên Internet để tìm các trang web có sẵn. Điều này được thực hiện bởi một phần mềm có tên là spider; tần suất giữa các lần trượt đất có thể mất nhiều ngày.
Đã lập chỉ mục
Đây là quá trình xác định các từ và cách diễn đạt mô tả chính xác nhất về trang web. Các từ đã xác định được gọi là từ khóa và trang được gán cho các từ đã xác định.
Tính toán mức độ liên quan
Công cụ tìm kiếm so sánh chuỗi tìm kiếm trong chuỗi yêu cầu với các trang được lập chỉ mục của cơ sở dữ liệu.
Bởi vì nhiều trang có nhiều khả năng chứa chuỗi tìm kiếm hơn, công cụ tìm kiếm bắt đầu tính toán mức độ liên quan của từng trang trong chỉ mục của nó với chuỗi tìm kiếm.
Có một số thuật toán để tính toán mức độ liên quan. Mỗi thuật toán này có các trọng số tương đối khác nhau cho các yếu tố chung như mật độ từ khóa hoặc liên kết.
Đó là lý do tại sao mỗi công cụ tìm kiếm cung cấp các trang kết quả khác nhau cho cùng một chuỗi tìm kiếm.
Theo thời gian các công cụ tìm kiếm thay đổi thuật toán của họ.
Lấy kết quả
Về cơ bản, nó chỉ đơn giản là hiển thị kết quả trong trình duyệt; vô số trang kết quả tìm kiếm được sắp xếp từ phù hợp nhất đến ít quan trọng nhất.
2- Thư mục
Thư mục là công cụ tìm kiếm phụ thuộc vào các hoạt động của con người cho danh sách của họ: một trang web được gửi tới thư mục và việc đưa vào danh sách phải được nhóm biên tập phê duyệt.
Quá trình này xảy ra như sau:
1-Chủ sở hữu của trang web gửi một mô tả ngắn về trang web của mình vào thư mục cùng với danh mục mà nó sẽ được liệt kê.
2-Trang web đã gửi được xem xét thủ công. Sau đó, nó có thể được thêm vào danh mục thích hợp hoặc nó có thể bị từ chối khỏi danh sách. Một trang web có nội dung tốt có nhiều khả năng được thêm vào hơn một trang web có nội dung kém.
3-Các từ khóa được nhập vào hộp tìm kiếm sẽ được khớp với mô tả của trang web. Điều này có nghĩa là các thay đổi được thực hiện đối với nội dung của trang web không được xem xét vì chỉ có phần mô tả của trang web mới quan trọng.
Ưu điểm là mỗi trang được xem xét về mức độ liên quan và nội dung trước khi đưa vào. Thông thường, khi có ít kết quả hơn có nghĩa là những gì bạn cần có thể được tìm thấy nhanh hơn.
Tuy nhiên, định dạng và bố cục không thân thiện với hầu hết mọi người và họ có thể gặp khó khăn với các tìm kiếm ít phổ biến hơn. Một bất lợi khác là có sự chậm trễ trong việc tạo trang web và đưa nó vào thư mục
Một số thư mục nổi tiếng bao gồm Dự án Từ điển Mở, Thư viện Công cộng Internet và DMOZ đã đóng cửa gần đây.
3- Công cụ tìm kiếm kết hợp
Các công cụ tìm kiếm này sử dụng cả công cụ tìm kiếm phân cấp và thư mục để liệt kê các trang web trong kết quả tìm kiếm.
Hầu hết các công cụ tìm kiếm nhện, như Google, về cơ bản sử dụng công cụ tìm kiếm phân cấp làm cơ chế chính và giám sát thủ công làm cơ chế phụ.
Đôi khi người dùng được cung cấp tùy chọn để tìm kiếm trên web hoặc một thư mục. Vào những thời điểm khác, người dùng có thể nhận được cả kết quả do con người quản lý và kết quả phân cấp trong cùng một tìm kiếm; trong trường hợp này, kết quả của con người thường được liệt kê đầu tiên.
Google và Yahoo là hai trong số các công cụ tìm kiếm chính nằm trong danh mục này, mặc dù ngày càng có nhiều công cụ tìm kiếm chuyển sang hệ thống này.
4- Động cơ Metasearch
Các công cụ tìm kiếm trên Internet này là những công cụ tìm kiếm các công cụ tìm kiếm khác cùng lúc và sau đó kết hợp các kết quả trong một danh sách duy nhất.
Ưu điểm là thu được nhiều kết quả hơn, nhưng mức độ phù hợp và chất lượng của chúng có thể bị ảnh hưởng đáng kể.
Ví dụ về công cụ tìm kiếm meta bao gồm Dogpile, Metacrawler và Clusty.
Người giới thiệu
- Các loại công cụ tìm kiếm khác nhau là gì (2016). Được khôi phục từ webnotes.com
- Tìm kiếm trên Internet: các loại công cụ tìm kiếm. Đã khôi phục từ libguides.astate.edu
- Các loại công cụ tìm kiếm (2008). Được khôi phục từ zeald.com
- Công cụ tìm kiếm và các loại của nó (2015). Đã khôi phục từ slideshare.com
- Công cụ tìm kiếm (2017). Được khôi phục từ computerhope.com