2013-08-01から1ヶ月間の記事一覧
スクレイピングバッチにかかせないのがhtmlのparse。いくつか方法をためしたのでまとめて見る。1)PDOMDocumentとかを駆使して連想配列化する方法 取得するHTMLによれば、おそらく最も手間がかからない方法。 手順は以下のとおり。・file_get_contents()でH…
とあるサイトのスクレイピングバッチを作成している最中、正規表現で思わぬとこでハマったのでメモ。○事象 文字列"$(initLive);"を空文字に置換(つまり削除)したかった。以下のとおり実装。 preg_replace("#[\$]\(initLive\);#", '', $contents)))));デリ…
注意点というか実はとても簡単で当然のことかもしれないけど、私自身簡単なこととか当然のことができなくてドハマリするタイプなので書いときます。ちなみにこの問題で私は3日間費やしました。はぁ。ちなみにレンタルサーバのスペックは・PHP5.1〜PHP5.5ま…
Ubuntuソフトウェアセンターでインストールしたeclipseを使っていたら、プラグインが追加できなくなった。調べてみたらeclipse/pluginディレクトリの書き込み権限がrootのみになっていた。 これが直接原因かは不明だが、今後権限でめんどうなことになるのは…
Ubuntuからターミナルで公開鍵認証方式でしか接続できないレンタルサーバにssh接続を試みた。結果うまくいかなかったが、備忘録的に途中経過をまとめとく。 ★2013/08/09追記 解決しました。 ◆まずはレンタルサーバにて公開鍵認証用鍵ペアの生成 使用するレン…
既にあるfuelPHP環境でバッチを作ろうと思いたち、"php oil refine robots"したら何故か以下のとおりエラーが出た。 Fatal error: Class 'Error' not found in COREPATH/bootstrap.php on line 54 Fatal error: Class 'Event' not found in COREPATH/bootstr…