Search Engine” สามารถแบ่งออกได้หลายประเภท โดยส่วนใหญ่แล้วจะอ้างอิงตามลักษณะการทำงาน ซึ่ง Search Engine สามารถแบ่งประเภทได้ดังนี้ …

Search-Engine

1. แบบอาศัยการจัดเก็บข้อมูลเป็นหลัก Crawler-Based Search Engine

Crawler-Based Search Engine คือ เครื่องมือค้นหาบนอินเทอร์เน็ต แบบอาศัยการบันทึกและจัดเก็บข้อมูลด้วยตัวเองเป็นหลัก เป็นประเภทของ Search Engine ที่ได้รับความนิยมในปัจจุบันมากที่สุด เช่น Google, Yahoo และ MSN ด้วยประสิทธิภาพในการค้นหาให้ความแม่นยำสูง และการประมวลผลการค้นหาภายในระยะเวลารวดเร็ว

Search-Engine-Spider

หลักการทำงานมีองค์ประกอบอยู่ 2 ส่วน

  1. ฐานข้อมูลของตนเองที่มีระบบการประมวลผลและจัดอันดับการค้นหา
  2. ระบบซอฟท์แวร์ อาศัยโปรแกรมตัวเล็กๆ ของ Search Engine นั้นๆ โดยใช้ในการเก็บหรือสำเนาข้อมูลหน้าเพจใหม่ๆ โดยทั้วไปมักเรียกว่า Web Crawler หรือ Spider หรือ Search Engine Robot ภาษาไทยเรียกว่า “แมงมุม” (Search Engine Spider)

เพื่อความชัดเจนในการเรียก Search Engine Robot สามารถระบุได้อีก เช่น

Google เรียกว่า Googlebot
Yahoo เรียกว่า Slurp
MSN เรียกว่า MSNbot

เจ้าแมงมุมจะเคลื่อนไปทุกเว็บไซต์ในอินเทอร์เน็ตที่มันตรวจพบ โดยจะเน้นการมองหาเว็บไซต์ใหม่ๆ เนื้อหาใหม่ๆ หรือแม้กระทั่งหน้าเพจเดิมที่มีการปรับปรุงเนื้อหาใหม่ (Update Content) อาศัยการไต่ไปตามลิงค์ต่างๆ ของหน้าเพจที่กำลังทำการตรวจสอบอยู่ และทำการ “สำเนาข้อมูล” ของหน้าเพจนั้นๆ ทั้งหมด (การ Copy ข้อมูลทุกอย่างที่ตรวจพบ) แล้วส่งข้อมูลที่ Copy ได้กลับไปยัง Server ต้นทางของตนเอง เพื่อทำการบันทึก (Pages Index) ลงสู่ฐานข้อมูลขนาดใหญ่ เมื่อใดที่เราทำการค้นหาสิ่งที่ต้องการ Search Engine Server จะเริ่มทำการประมวลผลจากฐานข้อมูลที่มีอยู่และแสดงผลการค้นหาออกมา …

2. แบบสารบัญเว็บไซต์ Web Directory

Web Directory มีหลักการทำงานเหมือนวิธีการใช้สมุดหน้าเหลือง มีเนื้อหาที่ถูกแยกหมวด และจัดทำดัชนีไว้แล้วอย่างเป็นระเบียบไว้ชัดเจน

ข้อดี สามารถเข้าไปดูข้อมูลของเว็บไซต์ทั้งหมดที่มีเนื้อหาเกี่ยวข้องกัน และตรงตามที่ต้องการของหมวดหมู่นั้นๆ ในปริมาณมาก และสามารถนำเอาข้อมูลเหล่านั้นมาเปรียบเทียบกับเว็บไซต์อื่นๆ กันได้เลย

สำหรับการโปรโมทเว็บสามารถทำได้ดังนี้

  • การลงทะเบียนเว็บไซต์ของเราลงสู่ระบบ
  • กรอกรายละเอียดที่จำเป็นเกี่ยวกับเว็บไซต์ของเรา ชื่อเว็บไซต์, URL, รายละเอียดอย่างย่อ, หมวดหมู่ของเว็บไซต์ที่เหมาะสมกับเว็บไซต์ของเรา, คำค้นหาที่เราต้องการ
  • ข้อมูลการลงทะเบียนเว็บไซต์ของเราจะถูกส่งต่อไปยังเจ้าหน้าที่ผู้ดูแลของสารบัญเว็บไซต์นั้นๆ โดยทั่วไปเรียกว่า Editor
  • หากกรอกข้อมูลครบถ้วน เจ้าหน้าที่ผู้ดูแลจะอนุมัติข้อมูลในการลงทะเบียน ลงสู่ฐานข้อมูลของสารบัญเว็บไซต์ …

Web-Directory

3. แบบอ้างอิงใน “ชุดคำสั่งเมตะ” Meta Search Engine

ชุดคำสั่งเมตะ มักจะมีอยู่ใน Code HTML ตามหน้าเพจต่างๆ เรียกว่า “Meta Tag

Meta Tag คือ ชุดแท็กคำสั่งที่ใช้สำหรับประกาศข้อมูลสำคัญต่างๆ ของเอกสารหน้าเพจนั้นๆ เช่น ชื่อผู้พัฒนา, เจ้าของเว็บไซต์, คำค้นหา (Keyword), คำอธิบายย่อของเว็บไซต์ โดยจะปรากฏในส่วนหัวของเอกสารเว็บ (Head Section) มีหน้าที่แจ้งข้อมูลสำคัญให้กับ Search Engine Robot ได้รับทราบ

Search Engine ประเภทนี้จะไม่มีระบบฐานข้อมูลของตนเอง แต่อาศัยข้อมูลจาก Search Engine Index Server จากที่อื่นๆ นำมาประมวลผลร่วมกัน ทำให้เกิดผลการค้นหาที่หลากหลาย แต่ในทางตรงข้าม ผลการค้นหาที่หลากหลายนั้นมักได้ผลลัพธ์ไม่ตรงเท่าที่ควร เนื่องจากอาศัยข้อมูลจาก Search Engine Index Server หลายๆ แห่งนำมารวมกัน

ฉะนั้น ชุดคำสั่ง Meta Tag จำเป็นมากสำหรับเว็บไซต์ที่ต้องการทำ Ranking สูงๆกับ Meta Search Engine โดยเฉพาะ เช่น ixquick และ Meta Crawler จาก InfoSpace …

Meta-Search-Engine