本文へジャンプします。



こんにちは、ゲストさん



現在位置: トップ > 秋元@サイボウズラボ・プログラマー・ブログ: GoogleがHTMLフォームの送信先もインデックスすると発表


(本文から引用)

前の画像 次の画像
張られているリンクをより多く見つける目的で、GooglebotにHTML Formを送信させて出てきたページもクロールさせる、という発表があった。
JavascriptやFlashの中から他ページへのリンクを抽出するというのは既に実施していて、今回はそれをページ上の入力フォームにも拡大するものだということ。いわゆるディープウェブ、見えないウェブといわれる領域への進出だ。
クロールされるフォームは以下のようなものに限定されるようだ。
GETメソッドであることrobot.txtなどで除外指定されていないことpasswordフィールドを持たないことuser, id, accountなどのフィールドを持たないこと
これらを満たすフォームに対して、クローラはいくつか適当な文字を入れてフォームを実行し、その結果新しいリンクが現れたらその先もクロール対象にする、ということ。
この方法で見つかったリンクはこれまでのPageRank計算には加算されず、クロール対象をより広げるために使われる。

この機能強化の影響だが、まずジェネレータ系や検索機能を持つサイトで、サブミットしないと情報が出てこなかったサイトで、よりGoogleの結果が増えそう...

続きを読む

この記事をクリップする

この記事をクリップしたユーザー一覧

  • monmonさん 2008/04/13 00:03

    タグ:

    コメント> クロールされるフォームは以下のようなものに限定されるようだ。
    >
    > * GETメソッドであること
    > * robot.txtなどで除外指定されていないこと
    > * passwordフィールドを持たないこと
    > * user, id, accountなどのフィールドを持たないこと
    >
    > これらを満たすフォームに対して、クローラはいくつか適当な文字を入れてフォームを実行し、その結果新しいリンクが現れたらその先もクロール対象にする、ということ。

    googleはこんなところにもくるのか


みんなのおすすめ商品(Amazon.co.jp)

  あなたもアフィリエイトを始めませんか?    

とある科学の超電磁砲 4―とある魔術の禁書目録外伝 (電撃コミックス) きのう何食べた? 3 (モーニングKC) NARUTO (巻ノ48) (ジャンプコミックス)  

とある科学の超電磁砲 4―とある魔術の禁書目録外伝 (電撃コミックス)

69人がクリックしました

著者:鎌池 和馬
出版社: M.Co.(角川グループパブリッシング)

きのう何食べた? 3 (モーニングKC)

37人がクリックしました

著者:よしなが ふみ
出版社: 講談社

NARUTO (巻ノ48) (ジャンプコミックス)

12人がクリックしました

著者:岸本 斉史
出版社: 集英社

 


他にもこんなクリップがオススメ

  1. 閲覧数1266 クリップ数160

    Google.co.jp 本文へ

    コメントぐーぐるさん


同じサイトでクリップされている記事

  1. 閲覧数439 クリップ数3

    秋元@サイボウズラボ・プログラマー・ブログ: mowser終了。創業者魂の叫び「モバイルなんか流行んねーよ!」 本文へ

    コメント> 家族や友人に数十万の借金があり、全部のクレジットカードは限度額いっぱい(しかも全部回収されそう)、もう一枚小切手が不渡りになったらアパートも維持できず、車は2回抵当に入ってて、電気は遮断、携帯電話も切られ、固定電話も止まった。今週末はバターで炒めたマカロニを食いながら過払いのPayPalデポジットが返って来るのを待つことになりそうだ。

    この実情酷過ぎるだろう

  2. 閲覧数405 クリップ数3

    秋元@サイボウズラボ・プログラマー・ブログ: 2006年検索ランキングの検証 本文へ

  3. 閲覧数298 クリップ数3

    Kazuho@Cybozu Labs: Ajax な HTML ページのソースコードを表示する 本文へ







携帯でアクセス

携帯アクセスバーコード
携帯で左のバーコードを読み取るか
URLを携帯に送信してください。

Powered by モバクシー




推奨画面サイズ
1024×768 以上

クリップBETAトップへ戻る