暇人の研究室

金融工学やR言語・統計学について書いてます。

<

2017-07-10から1日間の記事一覧

【R言語】rvestパッケージによるウェブスクレイピング その2

www.tkstock.site 前回に引き続いて今回は実際のWebサイトをスクレイピングしていきます。 というわけで新世紀エヴァンゲリオンのWikipediaのデータ(新世紀エヴァンゲリオン - Wikipedia)をスクレイピングしてタグや文字の検索・抽出を行っていきます。 ##…

【Web技術】Rでのスクレイピングにおける文字コードの確認と変換

文字コードとは? コンピュータ内部では文字であろうと画像であろうと、あらゆるものを数値で処理しています。 文字コードとはPC上で文字を表示させる仕組みで、ひらがな・カタカナ・漢字にそれぞれ特定の数値を当てはめて区別する仕組みです。 ちなみに日本…