• ĐĂNG TIN VÀO DIỄN ĐÀN
    Trang 1 của 3 123 CuốiCuối
    Kết quả 1 đến 10 của 25
    1. #1

      Ngày tham gia: Aug 2013
      Đang sống tại: Hà Nội
      Yahoo: shopweb_vn
      SDT: 0986 883 843
      Bài viết: 932

      Google dùng ngữ cảnh để xác định liên kết rác như thế nào

      Được khẳng định bằng sự ra đời của Penguin, máy tìm kiếm ngày càng chú ý đến việc rải liên kết nhằm mục đích thao túng links và anchor text của một trang. Penguin chính thức được cập nhật vào này 24 tháng 4 năm 2012 và cùng với đó là một bài viết trên blog chính thức của Official Google Webmaster Central mang tên "Một bước tiến nữa để có được các trang web chất lượng cao".

      Nội dung bài viết đề cập Google đang giảm dần thứ hạng các trang có dấu hiệu vi phạm Hướng dẫn cho quản trị Web của Google (Google’s Webmaster Guidelines). Bài viết do Matt Cutts, người đứng đầu Web Spam của Google viết, trong đó ông nêu rõ:

      Chúng tôi sẽ không tiết lộ các dấu hiệu cụ thể bởi chúng tôi không muốn người dùng “chơi chiêu” với máy tìm kiếm, giảm tương tác người dùng, gợi ý duy nhất của chúng tôi dành cho các quản trị web là hãy tập trung vào việc tạo ra các trang web chất lượng cao, nâng cao trải nghiệm người dùng và sử dụng SEO mũ trắng thay vì cố gắng dùng các thủ thuật không được khuyến cáo.

      Bài viết đã chỉ rõ các trường hợp mà Web Spam sẽ nhắm tới, đó là các trang có dấu hiệu nhồi nhét từ khóa, liên kết không tự nhiên, và nội dung trùng lặp. Tháng trước tôi viết một bài viết nói về cách Google nhận dạng nội dung trùng lặp: Google Scoring Gibberish Content to Demote Pages in Rankings? (Google đánh giá nội dung trùng lặp để giảm thứ hạng trang web?)

      Năm 2004, Google đã cấp bằng sáng chế cho phương thức giúp máy tìm kiếm kiểm tra ký hơn nội dung bao quanh liên kết để giúp hiểu rõ hơn ngữ cảnh của liên kết kết đó. Trong ví dụ của liên kết không tự nhiên trong bài viết của Webmaster Central blog, chúng tôi nắm rõ được cách thức của một liên kết được tạo ra trong ngữ cảnh có ý nghĩa hoàn toàn phù hợp với ngữa cảnh và nội dung bài viết:

      Lạm phát thứ hạng tìm kiếm do liên kết

      Bằng sáng chế có chỉ ra một số các "kỹ thuật thổi phồng thứ hạng các nội dung, do đó làm giảm chất lượng kết quả tìm kiếm":

      Liên kết rác – bao gồm một lượng lớn các liên kết của một trang nhằm mục đích tăng hạng cho trang đó. Họ đưa ra ví dụ có một số Spammer trả tiền cho chủ các trang có thứ hạng cao để được liên kết với họ để kéo thứ hạng trang của họ tăng lên”.

      Anchor Text rác – là hình thức mua lại các liên kết từ một số lượng lớn các trang liên kết đến một trang sử dụng cùng một anchor text (neo văn bản- các website kém chất lượng), để trang đó được xếp hạng cao cho từ khóa đó trong kết quả tìm kiếm.

      Thả bom Google
      - Rất giống với neo văn bản rác, phương pháp này nhằm mục đích thao túng bảng xếp hạng nhằm mục đích chính trị chứ không phải nhằm mục đích tăng lợi nhuận kinh tế hay thương mại.

      Cấu trúc trang: rất nhiều trang thiết kế trang với các liên kết như “liên kết sản phẩm”, “liên kết nghề nghiệp”, “liên kết nhà đầu tư”, vv…để “thổi phồng” thứ hạng các trang liên kết đó.

      Để xử lý và tránh các “kỹ thuật” kể trên, bằng sáng chế đưa ra một cách đó là máy tìm kiếm sẽ lưu tâm hơn đến ngữ cảnh xung quanh của một liên kết để quyết định thăng hay giáng thứ hạng của nội dung hay trang chứa liên kết đó.

      Thông tin chi tiết bằng sáng chế:
      Xếp hạng dựa trên ngữ cảnh tài liệu tham khảo
      Sáng tạo bởi Anna Patterson và Paul Haahr
      Trao cho Google
      US Patent8.577.893
      Cấp ngày 05 tháng 11 2013
      Nộp: ngày 15 tháng 3 năm 2004
      Tóm tắt nội dung sáng chế

      Là một hệ thống xếp hạng nội dung dựa trên ngữ cảnh đi kèm vớitài liệu tài liệuđó. Hệ thống sẽxác định một tài liệu tham khảo trong nội dungthứ nhất và tài liệu tham khảo nàycó liên quan đến một nội dung thứ hai. Hệ thống phân tích một phần của tài liệu đầu tiên liên quan đến tài liệu, xácđịnh một hoặc vài từ hiếm, tạo ngữ cảnh cho từ hiếm đó và xếp hạng nội dung thứ hai dựa trên ngữ cảnh dùng để nhận dạng kia.

      Một thông tin nữa làđồng sáng tạo của sáng chếnày là Anna Patterson, phụ trách các bằng sáng chế thu thập dữ liệu của Google.

      Xếp hạng dựa trên ngữ cảnh là quá trình như thế nào?

      Khi máy tìm kiếm thu thập dữ liệu, nó có thể nhận diện các liên kết có trong trang và khoanh vùng dữ liệu xung quanh liên kết đó, ví dụ như bán kính năm từ (bên trái 5 từ, bên phải 5 từ) kể từ chỗ đặt liên kết. Trong ảnh trên, chúng ta có thể thấy một liên kết có anchor text "Saturn (Sao Chổi)”, và ngữ cảnh bên trái liên kết là “Beautiful of all the planets (Đẹp nhất trong các hành tinh)” và bên phải là “Is surrounded by an elegant (được bao quanh bởi 1 vành đai)”.

      Bước tiếp theo Google sẽ xác định “từ hiếm nhất” trong phần nội dung liên quan đến liên kết, sử dụng quá trình nghịch đảo tần số tài liệu IDF (Viết tắt của inverse document frequency).

      Trong trường hợp này, "hành tinh" là từ hiếm nhất trong ngữ cảnh bên trái và “vành đai” là từ hiếm nhất trong ngữ cảnh bên phải. Sáng chế nêu rõ ngữ cảnh xung quanh liên kết chỉ nên nằm trong khoảng 5 từ.

      Chỉ nên dùng các từ chính được xác định bằng tần số xuất hiện của từ đó trong một số lượng nội dung nhất định, khoảng 50 nội dung chẳng hạn. Như thế đủ để xác định khối văn bản ngẫu nhiên bao gồm các từ được sử dụng.

      Có thể có rất nhiều tài liệu liên kết đến một trang, và tiếp cận ngữ cảnh nghĩa là xác định thông tin của các trang tiềm năng. Ngữ cảnh nào có nhiều trang cùng sử dụng một loại từ ngữ gần các liên kết thì được xác định là thông tin ngữ cảnh. Do Sao thổ là một hành tinh, thế nên sẽ có rất nhiều các liên kết bao gồm từ “hành tinh” cùng với anchor text “sao thổ” trỏ đến trang đó. Và cũng bởi vì Sao thổ được coi là một vì tinh tú nên từ “tinh tú” sẽ xuất hiện gần liên kết với trang nói về Sao thổ sử dụng anchor text “Sao thổ”.

      Những "bối cảnh" dùng để xác đinh “từ hiếm” xung quanh liên kết, hay “ngữ cảnh nhận dạng” được đề cập trong sáng chế dùng để đánh giá liên kết, đồng nghĩa với đánh giá xếp hạng một tài liệu. Các yếu tố khác cũng dùng để đánh giá bao gồm:

      - Số lượng liên kết trỏ đến nội dung.
      - Chất lượng nội dung trỏ đến.
      - “Sự tươi mới” của nội dung trỏ đến.
      - Các yếu tố xếp hạng cơ bản khác.
      Nhìn vào ví dụ ở trên về liên kết không tự nhiên, từ ngữ xung quanh liên kết không mấy liên quan đến nội dung.

      Nếu không có nhiều ngữ cảnh nhận dạng, hoặc có quá nhiều ngữ cảnh nhưng không đủ độ tin cậy, thì việc xếp hạng liên kết đó sẽ bị bỏ qua. Sáng chế này không có ý nói rằng các yếu tố đó là thứ hạng trang (PageRank) hay một dấu hiệu siêu văn bản liên quan.

      Số lượng ngữ cảnh nhận dạng có thể thay đổi theo thời gian, do vậy có thể linh động một lượng bất kỳ. Một trang mà kiếm được nhiều liên kết trong một thời gian ngắn mà có cùng một ngữ cảnh nhận dạng thì cần phải xem xét lại và các liên kết đó sẽ không được tính đến trong quá trình đánh giá xếp hạng trang mà liên kết đó trỏ đến. Một trang có nhiều ngữ cảnh nhận dạng khác nhau sẽ được xếp thứ hạng cao hơn.

      Tóm tắt

      Bằng sáng chế này đã được đệ trình gần mười năm trước, nhưng chỉ mới được công nhận gần đây. Không ai có thể khẳng định Google sẽ sử dụng quy trình của sáng chế này, hoặc sử dụng nó thay thế cho các phương thức khác hoặc sẽ tiếp tục sử dụng nó.

      Những vấn đề mà nó nhắm đến để giải quyết như liên kết rác, anchor text rác, thả bom Google, và cấu trúc trang on-page ... là những vấn đề Google vẫn đang phải đau đầu tìm cách giải quyết. Mặc dù các hướng dẫn hoặc các cập nhật mới như Google Penguin đã được phổ biến đến các quản trị web trong Google Webmaster tools, thì dường như Google vẫn là nhân vật năng nổ nhất trong việc giải quyết các vấn nạn này.

      Bạn sẽ để ý hơn tới các từ ngữ mà bạn dùng xung quanh liên kết của mình trong thời gian tới không?


      - Ghi rõ nguồn Diễn Đàn Rao Vặt Miễn Phí khi đăng tải các bài viết này.
      - Bài viết có tham khảo nội dung của tác giả Bill Slawski (Seoby...)
      - Link bài: Google dùng ngữ cảnh để xác định liên kết rác như thế nào

    2. #2

      Ngày tham gia: Dec 2013
      Đang sống tại: HCM
      Yahoo: tiennv0409
      SDT: 0933 965 924
      Bài viết: 254
      theo e các từ ngữ xung quanh anchor text cũng phải liên quan đến nhau như thế gg dễ phát hiện chủ đề cần nhấn mạnh và link sẽ tự nhiên hơn !!!

    3. #3

      Ngày tham gia: Dec 2013
      Đang sống tại: HA NOI
      Yahoo: quachtinh_g
      SDT: 0916076125
      Bài viết: 34
      Đọc bài viết 1 lần vấn thấy khá mơ hồ các bác ạ, có phải là bài viết của mình những từ ngữ nên có liên qua đến anchortext không? Hay phải viết bài như thế nào để thỏa mãn bằng sáng chế này nếu GG áp dụng nhỉ???

    4. #4

      Ngày tham gia: Sep 2013
      Đang sống tại: Hà Nội
      Yahoo: kesieuway
      SDT: 0903688439
      Bài viết: 104
      dạo này từ khóa mình mất top quá, chẳng hiểu rõ nguyên nhân khi link và nội dung vẫn đều, thấy đối thủ mất lượng lớn link theo ahrefs mà vẫn giữ vị trí, hơi bị chán

    5. #5

      Ngày tham gia: Nov 2013
      Đang sống tại: Hà Nội
      Yahoo: ducviettvc
      SDT: 0982471888
      Bài viết: 4
      Không hiểu cho lắm, khó thật

    6. #6

      Ngày tham gia: Nov 2013
      Đang sống tại: hà nội
      Yahoo: tocngan_277
      SDT: 0986595597
      Bài viết: 78
      mình cũng thấy từ khóa dạo này có sự giao động, của mình thì tí chút thôi, nhưng các đối thủ thấy giao động khá. mà cũng đang phân phân không biết ngay đi bao link là đủ nữa hic

    7. #7

      Ngày tham gia: Jan 2014
      Đang sống tại: HCM
      Yahoo: N/A
      SDT: N/A
      Bài viết: 1
      nói chung là cần đa dạng hóa anchor text, đa dạng hóa link, không phải cứ chen chúc vô PR cao hoài là tốt, cần có cao có thấp

    8. #8

      Ngày tham gia: Oct 2013
      Đang sống tại: hà nội
      Yahoo: shopvochong123
      SDT: 01674526130
      Bài viết: 4
      Không ai có thể khẳng định Google sẽ sử dụng quy trình của sáng chế này, hoặc sử dụng nó thay thế cho các phương thức khác hoặc sẽ tiếp tục sử dụng nó.

    9. #9

      Ngày tham gia: Jan 2014
      Đang sống tại: hà nội
      Yahoo: Du0nG_sq@yahoo.com
      SDT: 0924646577
      Bài viết: 46
      Trích dẫn Gửi bởi anphatco Xem bài viết
      dạo này từ khóa mình mất top quá, chẳng hiểu rõ nguyên nhân khi link và nội dung vẫn đều, thấy đối thủ mất lượng lớn link theo ahrefs mà vẫn giữ vị trí, hơi bị chán
      Chắc là chỉ mất những link cùi, mà lại bổ sung thêm link chất lượng. Mà dạo này nhiều từ khóa bị vậy, khó hiểu lắm

    10. #10

      Ngày tham gia: Nov 2013
      Đang sống tại: tp.hcm
      Yahoo: chipchip_boy_166@yahoo.com.vn
      SDT: 05673474357
      Bài viết: 186
      hơi khó hiểu. Có lẽ nội dung được dịch từ bản nước ngoài. nói chung là chúng ta làm gi xấu google đều biết cách triệt phá và ngăn chặn



    Các Chủ đề tương tự

    1. Thống kê Google Adwords trong Google Analytics
      Bởi ADSEOMxh trong diễn đàn Thảo Luận SEO
      Trả lời: 10
      Bài viết cuối: 11-20-2015, 10:16 AM
    2. Trả lời: 0
      Bài viết cuối: 04-11-2015, 02:32 PM
    3. Trả lời: 0
      Bài viết cuối: 10-16-2014, 02:57 PM

    Quyền viết bài

    • Bạn Không thể gửi Chủ đề mới
    • Bạn Không thể Gửi trả lời
    • Bạn Không thể Gửi file đính kèm
    • Bạn Không thể Sửa bài viết của mình
    •