暇人の研究室

金融工学やR言語・統計学について書いてます。

<

R

【R言語】rvestパッケージによるウェブスクレイピング その2

www.tkstock.site 前回に引き続いて今回は実際のWebサイトをスクレイピングしていきます。 というわけで新世紀エヴァンゲリオンのWikipediaのデータ(新世紀エヴァンゲリオン - Wikipedia)をスクレイピングしてタグや文字の検索・抽出を行っていきます。 ##…

【Web技術】Rでのスクレイピングにおける文字コードの確認と変換

文字コードとは? コンピュータ内部では文字であろうと画像であろうと、あらゆるものを数値で処理しています。 文字コードとはPC上で文字を表示させる仕組みで、ひらがな・カタカナ・漢字にそれぞれ特定の数値を当てはめて区別する仕組みです。 ちなみに日本…

WEB上でデータを配信技術のまとめ(http・HTML・XML・AJAX・JSON)

HTML GooglechromeやFirefoxなどのインターネットブラウザでWebページを表示する際、その情報をどのようにして書くのかという構造基準が存在しています。 これがハイパーテキストマークアップ言語、いわゆる『HTML』というやつです。 これはWikipediaからTwi…

【R言語】xtsパッケージによる時系列データの操作

Rでは時系列データを扱うための様々なパッケージまたはクラス(オブジェクト)が用意されています。今回はその1つであるxtsパッケージについて紹介していきます。 古いRの参考書だと時系列データは全部tsパッケージでやっているものがよくありますが、金融デ…

【R言語】Rでブラック・ショールズ・モデルの計算をしてみる その2

www.tkstock.site ↑に引き続き、今度はプットオプションの価格をBSモデルを使って計算していきます。 コールオプションが買う権利であるのに対して、プットオプションは売る権利なので、行使価格Kの値は大きい(原資産額が低い)ほど大きな利益をあげること…

【R言語】Rでブラック・ショールズ・モデルの計算をしてみる その1

www.tkstock.site 今回はRを使ってブラックショールズモデルの関数を作ってみます。 www.tkstock.site 今回は公式の通り、原資産額(S)・行使価格(K)・ボラティリティ(σ)・無リスク金利(r)・期間(T)を使ってコールオプションの価格(原資産額Sの金…

【R言語】functionで関数を自作するための基礎知識 その1

R

Rの長所としてはfunction()という関数を使うことで特定の変数に自分の作った計算コードを保存できるという点があります。まあ自分で複雑なfunctionのスクリプトを書いてパッケージが作れるくらいが理想なのですが、現実はパッケージ頼りという人が結構多いと…

【R言語】RでTwitterのデータを取得してみる

Rではウェブページのデータを引っ張ってくる(スクレイピング)するだけでなく、RからWEB APIを介してWEBサービスを利用することもできます。 今回は有名なAPI WEBサービスの1つであるTwitterのデータ取得します。これには「twitteR」というパッケージがと…

【R言語】Rでの単位根検定 その2

www.tkstock.site というわけで前回に引き続き、Rでの時系列データを使った単位根検定を行っていきます。前回の結果としては2005年から2016年までのTOPIXのデータには、時系列分析を行う上で必要な定常性がありませんでした。なのでデータを加工することで、…

【R言語】Rでの単位根検定 その1

R

時系列データは大きく「定常過程」と「非定常過程」の2つに分けることできます。そして、分析するデータが「定常過程」であるか「非定常過程」であるかを検定するのが、「単位根検定」というやつです。 Rで単位根検定を行うには、元からRにインストールされ…

【R言語】時系列分析にオススメパッケージまとめ

R

まず時系列データとは時間と共に変化するデータの事を指し、代表的なものとしては株価データや気象データがあります。 時系列データ解析はデータの数値だけではなく、時間的な位置も意味合いを持つので他のデータ解析とは少し異なるアプローチで分析していか…

【R言語】Rでのプログラミング  その1

R

・条件文(if文) Rでは、ifとelseを使って条件文が書けます。 書式は>if (条件式) (処理) else (処理) といった感じです。 簡単な例としてxが10未満かどうかを判定し結果を表示します > if(x<10)"YES"else"NO"[1] "YES" ちなみにRにおいて不等号(≦・≧)は<…

【R言語】rvestパッケージによるウェブスクレイピング その1

R

Rで実際にウェブ上のHTML・XML形式のデータをスクレイピングするには、rvestパッケージがオススメです。 rvestパッケージは何をしてくれるパッケージなのかというと、HTMLやXMLからデータを検索・抽出するための言語であるxpath(XML Path Language)をRで簡…

【Web技術】スクレイピングする上で抑えておきたいHTMLの基本的な仕組み

R

近頃はビックデータの時代でデータ集めや分析が簡単になりました。そしてデータの収集先で一番多いのがインターネットです。 インターネットからデータを集める方法の1つとしてサイトの情報をそのまま引っ張ってくるスクレイピングというものがあります。 …

【R言語】dplyrパッケージの使い方

R

今回はRでデータ処理を効率的に行うのを手助けしてくれるパッケージの一つであるdplyrパッケージの使い方を紹介していきます。この記事ではざっくりとした説明で、詳しく知りたい方はこちらの本に書いてあるので是非どうぞ Rによるスクレイピング入門 石田 …

【R言語】時系列モデルの残差解析

前回は時系列データからARモデルを作りました。そしてこの算出したモデルが本当に合っているかどうかの条件は、モデルの値と実現値の誤差項(残差)を調べ、それがホワイトノイズであることです。 もし残差がホワイトノイズであれば、モデルの当てはめは成功…

【R言語】自己相関係数の算出方法

株価収益率などの時系列データではデータの値と観測時点が記録されおり、時系列分析では、このデータの並び順に意味を見出すことが分析において重要になってきます。 なので、通常の分析では「異なる2つの変数」の相関関係を計算するのに対して時系列分析で…

【R言語】R内部のオブジェクトを確認・削除する方法

R

今回はR内部に保存したオブジェクトの確認方法について書いていきたいと思います。Rで統計解析をおこなう際に使用した変数(オブジェクト、ベクトルなど)は、Rでは内部で記憶され、Rを終了する時に「作業スペースを保存しますか?」と聞かれたときに「はい…