Google” จัดอยู่ในประเภทของ Crawler-Based Search Engine เน้นระบบการทำงานด้านจัดเก็บข้อมูลและการประมวลผลการค้นหาอย่างเต็มรูปแบบ โดยมีอัลกอลิทึ่ม (Algorithm) มีการออกแต้ม “ค่าคะแนนความน่าเชื่อถือของหน้าเพจ” หรือที่เรียกว่า “Google PageRank” ซึ่งประกอบไปด้วยสูตรสมการคณิตศาสตร์ที่ซับซ้อนในการหาค่าลำดับคะแนนที่ Google ประเมินให้กับคุณภาพของเนื้อหา ในหน้าเว็บเพจแต่ละหน้า ที่ปรากฎอยู่ในเว็บไซต์  …

ระบบการทำงานของ Google

Google สามารถแยกการทำงานออกเป็น 3 ส่วนใหญ่ๆ คือ

1. Googlebot

โปรแกรมแมงมุม เป็นโปรแกรมคอยเก็บข้อมูลเว็บไซต์ต่างๆ โดยทำการ “ไต่” (Crawl) ไปตามลิงค์ที่ตรวจพบ หรือ ได้รับคำสั่งจากเครื่องแม่ข่าย (Server) ให้ไปเก็บข้อมูลใหม่ตามที่มีผู้มาลงทะเบียน URL กับทางระบบออนไลน์ของ Google (Google Submit URL)

2. Index Server

ระบบการจัดเก็บข้อมูลเอกสารที่ถูก Copy มา ซึ่งเก็บข้อมูลที่ได้รับมาจาก Googlebot โดยข้อมูลที่นำมาทำการจัดเก็บ ส่วนใหญ่จะเป็นเอกสารหน้าเพจ (HTML Document) และไฟล์เอกสารรูปภาพต่างๆ (Image Document) เก็บข้อมูลทั้งหน้าเพจ ทุกรูปภาพ ทุกตัวอักษร เป็นการสำเนาเอกสาร (Copy Document) เรียกว่า “การ Index หน้าเพจ

Index Server จะอำนวยความสะดวกในการให้เอกสารที่มีอยู่ในระบบการค้นหา แสดงผลได้ตรงกับเอกสารปัจจุบันให้มากที่สุด (ข้อมูลจริงบนเว็บไซต์) การ Index ข้อมูลทั้งหมด ระบบการประมวลผลจะทำการตัดคำสิ้นเปลือง และคำหยุด (common words หรือ stop words) ออกไปจากหน้าเอกสาร (เช่น the, is, on, or, of, a, it) เพื่อลดอัตราการสิ้นเปลืองในการประมวลผลแต่ละครั้งให้เหลือน้อยที่สุด

3. Query processor

เป็นตัวประมวลผลและรับคำสั่งจาก “ช่องสำหรับใส่คำค้นหา” Search Box โดยจะประมวลผลจากเอกสารที่ได้รับการ Index ไว้บนเครื่อง Server ของ Google เท่านั้น และอ้างอิงตามหลัก อัลกอริทึ่ม (Algorithm) และ PageRank เพื่อใช้ในการจัดอันดับแสดงผลการค้นหา (Search Engine Results Page : SERP) และช่วยเพิ่มความแม่นยำในการค้นหา …