
阿修羅ワークス
次のオプションからは取得するコンテンツの品質に影響するオプションです。
影響するオプションは4つあります。
影響するオプションは4つあります。
5.要素の取得開始位置をランダムにするか
6.ピックアップするセンテンス数
7.センテンスの最低文字数
8.投稿する最低文字数
このオプションは重要そうですね!

ランファ

阿修羅ワークス
はい。
「要素の取得開始位置をランダムにするか」はランダムにする場合は1を。しない場合は0または空白を指定します。
初期設定ではランダムにするとなっています。
ランダムにした場合は、収集したコンテンツからランダムにセンテンス(文章)をピックアップします。
しない場合は、検索結果の上位から順にセンテンス(文章)をピックアップします。
「要素の取得開始位置をランダムにするか」はランダムにする場合は1を。しない場合は0または空白を指定します。
初期設定ではランダムにするとなっています。
ランダムにした場合は、収集したコンテンツからランダムにセンテンス(文章)をピックアップします。
しない場合は、検索結果の上位から順にセンテンス(文章)をピックアップします。
これも0または1を指定するタイプですね。0の場合は省略してもいいんだ!

ランファ

阿修羅ワークス
はい。
以下のようになります。
以下のようになります。
検索キーワード::タイトル::1234::0::1

阿修羅ワークス
次に「ピックアップするセンテンス数」は収集したコンテンツから段落をいくつ取得するかを指定します。
初期設定では最大15個の段落をピックアップします。段落として認識するのは<p>タグで囲まれた文章です。または句点の「。」までを一区切りとします。
初期設定では最大15個の段落をピックアップします。段落として認識するのは<p>タグで囲まれた文章です。または句点の「。」までを一区切りとします。
単純に「ピックアップするセンテンス数」を増やすと長文となり、減らすと短文となります。
以下のようになります。
検索キーワード::タイトル::1234::0::1::15
短文か長文かも指定できるんですね!

ランファ

阿修羅ワークス
はい。
次に「センテンスの最低文字数」ですが、収集したコンテンツからセンテンスをピックアップする際に、最低何文字以上の文章であるかを指定します。
初期設定では40文字以上ある文章からピックアップします。短すぎると文章とは言い難い散文的な文字列も拾ってしまいます。
長くすると長文からのみピックアップするようになります。
以下のようになります。
次に「センテンスの最低文字数」ですが、収集したコンテンツからセンテンスをピックアップする際に、最低何文字以上の文章であるかを指定します。
初期設定では40文字以上ある文章からピックアップします。短すぎると文章とは言い難い散文的な文字列も拾ってしまいます。
長くすると長文からのみピックアップするようになります。
以下のようになります。
検索キーワード::タイトル::1234::0::1::15::40
文章の文字数で文章っぽいものを抽出できるわけですね。

ランファ

阿修羅ワークス
そういうことです。
次に「投稿する最低文字数」ですが、最終的に投稿する文章の最低文字列数を指定します。テンプレートのHTMLタグは文字数としてカウントしません。
初期設定では最低100文字以上ないと投稿しません。
例えば800文字と指定すると、800文字に満たない文章である場合は投稿しません。
4000と指定すると、4000文字を超えないと投稿しないということになります。
最終的に何文字になるかは、検索キーワード×ピックアップするセンテンス数×検索エンジンの検索結果 などに依存します。
次に「投稿する最低文字数」ですが、最終的に投稿する文章の最低文字列数を指定します。テンプレートのHTMLタグは文字数としてカウントしません。
初期設定では最低100文字以上ないと投稿しません。
例えば800文字と指定すると、800文字に満たない文章である場合は投稿しません。
4000と指定すると、4000文字を超えないと投稿しないということになります。
最終的に何文字になるかは、検索キーワード×ピックアップするセンテンス数×検索エンジンの検索結果 などに依存します。
以下のようになります。
検索キーワード::タイトル::1234::0::1::15::40::100
このオプションは重要そうですね。特に文字数を気にする人は。

ランファ

阿修羅ワークス
かなり重要です!