Yếu tố kích thước và các chỉ số trong thuật toán xếp hạng của Google

Dear all,

Trong quá trình thiết kết website, hầu như người ta không quan tâm đến những vấn đề về kích thước website, những chỉ số về số lần request server,… đã không được quan tâm, tuy nhiên với Google điều đó là thật sự cần thiết cho tất cả chúng ta, nếu như phải bắt đầu 1 dự án SEO từ công đoạn thiết kế web, thì đây là bài viết mà tôi nghĩ nó cần thiết để tối ưu hóa tốt hơn.

kich-thuoc-seo

Kích thước SEO

Mình sẽ thống kê về kích thước, số lượng các nguồn tài nguyên trên internet. Chúng sẽ được Google bots thu thập dữ liệu và tiến hành lập chỉ mục.

Khi thiết kế web, các bạn cần lưu ý những điểm sau đây:

    • Các trang web trung bình chiếm 320 KB
    • Khi chúng ta nén thì chúng ta phải đo được kích thước sau khi nén, nếu nó chỉ bằng 1/3 kích thước ban đầu là tốt.

80% những pages trên website của bạn phải được nạp từ 1 server nhất định. Ví dụ như website của bạn nội dung chỉ request một ít từ database, còn lại đa số request từ những trang như vnexpress, dân trí, … để lấy dữ liệu từ những trang này.Loại bỏ bàng nhiều giao thức http trên 1 trang càng tốt, ví dụ như bạn lấy 10 file CSS trên 1 trang, thì nay bạn gộp lại chỉ còn 2 trang CSS thôi, tương tự cho javascript

Ngoài ra, bạn cũng nên chặn những con Google Bots vào những folder như JS, CSS,… những folder này khi Google bots nó rất dễ mắt kẹt vì không đọc nổi những thư viện Javascript, gây mấy thời gian và số lần request của Google Bots.

Một vài website thì họ lại không làm như vậy, họ quét chọn agent Google bots và sau đó chuyển hướng đến một Page, hoặc một folder nào đó mà nơi đó JS và CSS được tối giản nhất có thể, còn với người dùng thì họ vẫn có những hiệu ứng bay lương, chim chóc đầy màu sắc :) .

Thực tế thì trước đây Google họ không nén file khi quét vì để tăng hiệu năng họ sẽ bỏ qua khi quét đúng file javascript quá số lần quy định hoặc quá số request lên server là nó hết phiên làm việc, vì vậy ngày nay một vài con Google bots sẽ bỏ qua hoặc nén những file này lại để tiện hơn trong quá trình thu thập dữ liệu website.

Yếu tố Top Sites All Sites Mô tả
Pages 380 million 4.2 billion Số sites và số pages Google đã phân tích, đánh giá
Resources 42.14 43.91 số tài nguyên trung bình trên mỗi trang
GETs 42.63 44.56 Số lần request Get trung bình của mỗi trang
Hosts 8.39 7.01 Số lần request trung bình trên 1 máy chủ duy nhất
Resources Per Host 5.02 6.26 Số lần request trung bình của những nguồn tài nguyên khác
Network Size/KB 312.04 320.24 Dung lượng trung bình của 1 page trên site
Document Size/KB 477.26 376.67 Dung lương trung bình của 1 page trên site nhưng có phần http header
Zippable Size/KB 287.51 170.16 Dung lượng trung bình của 1 page chứa Content-Type of ‘text/*’
Unzipped Size/KB 32.67 57.07 Dung lượng trung bình có thể nén được trên 1 page, mà page đó Content-Type không chứa Gzip hoặc deflate
Zipped Ratio 89% 66% Tỷ lệ trung bình dung lương có thể nén được
Images 27.58 29.39 số hình ảnh trung bình 1 page
Image Size/KB 184.73 205.99 tổng kích thước hình ảnh
Scripts 6.75 7.09 Số file js ra ngoài
Script Size/KB 66.48 57.98 Tổng kích thước file
Combinable Scripts 4.75 3.75 số request trung bình để lấy file js
Stylesheets 4.07 3.22 số request để lấy file CSS
Stylesheet Size/KB 27.17 18.72 Dung lượng file CSS
Combinable Stylesheets 3.54 2.02 Dung lượng tiết kiểm trung bình mỗi file CSS
Yếu tố Tier Mean Min 10 20 30 40 Median 60 70 80 90 Max
GETs Per Page Top Sites 42.63 1 17 21 25 28 33 39 48 60 81 977
All Sites 44.56 1 10 18 24 30 37 45 54 66 86 2,758
Hosts Per Page Top Sites 8.39 1 3 3 4 4 7 8 10 12 17 222
All Sites 7.01 1 1 2 3 4 5 7 8 10 14 374
KB Per Page Top Sites 312.04 0.00 38.15 80.44 119.28 145.51 176.23 208.38 275.48 377.16 597.08 312,426.25
All Sites 320.24 0.00 21.82 54.15 90.76 131.30 177.47 234.67 310.51 428.73 663.19 517,026.13
KB Per Host Top Sites 37.18 0.00 0.73 1.76 3.92 6.73 11.18 17.12 26.75 55.45 132.76 311,872.59
All Sites 45.69 0.00 0.78 1.94 3.60 6.96 13.09 23.97 44.12 85.15 179.08 441,631.71
KB Per GET Top Sites 7.32 0.00 0.46 0.68 1.06 1.60 2.36 3.19 4.76 7.76 16.75 14,852.58
All Sites 7.19 0.00 0.43 0.63 0.92 1.31 1.93 2.90 4.38 7.96 18.46 35,932.92
GETs Per Host Top Sites 5.08 1.00 2.11 2.88 3.50 4.50 5.62 6.75 8.00 9.20 11.25 401.00
All Sites 6.36 1.00 2.33 3.29 4.20 5.14 6.25 7.60 9.33 12.08 18.00 1,045.00
Max GETs Per Host Top Sites - 1 5 9 12 15 18 21 26 33 39 860
All Sites - 1 6 10 15 19 24 29 36 44 59 2,754

Đây là số liệu do Google cung cấp, các bạn cũng nên tham khảo để biết thêm, không thì bỏ qua vì nó không ảnh hưởng quan trọng đến website, nói chung, các bạn chỉ cần hạn chế những thứ sau đây:

  1. Số lần request file javascript, CSS
  2. Nén những file này trước khi include vào website
  3. Gộp những file này lại với nhau nếu chúng có thể và ko gây xung đột cho nhau
  4. Javascript các bạn nên đưa xuống cuối trang là tốt nhất
  5. Chặn Bots không cho vào những folder không chứa dữ liệu, những folder về js, CSS,…

 

About Trọng Khiêm

Chào các bạn, mình là Khiêm. Niềm đam mê của mình là SEO và Website Deverloper, rất vui khi được làm quen với tất cả các bạn. Nếu cần hỗ trợ, hãy mail cho mình: buitrongkhiem2010@gmail.com Mình sẽ tư vấn SEO tổng thể website, On Page, Off Page hoặc tư vấn chiến lược khôi phục Website sau khị dính thuật toán của Google. :)
This entry was posted in Thảo Luận SEO. Bookmark the permalink.

Gửi phản hồi

Bài viết này thuộc về Bùi Trọng Khiêm - ©hocseodelam 2013