MediaWikiのAPIを使ってページを自動作成する

提供: サイバーネットワーク研究所
移動先:案内検索

筆者は、MediaWikiを自分のための情報収集と整理に使っています。いわば、個人のナレッジマネジメントですが、そのときに重宝しているのが、MediaWikiのAPIを使用するクライアントアプリケーションです。タイトルとページコンテンツを与えて新規ページを作成するという至って簡単なものですが、その割には役にたっています。記述言語はPHPです。

最近ではAPIを使ったCMS管理が必須になっていますが、「APIを使ったクライアントアプリケーションの作成は簡単だよ」という例です。

ソースはGitHubにあげています。MediaWikiシステムをプライベートに利用している方は(あまり多くないとは思いますが)、カスタマイズしてそれぞれの用途で利用してください。


週別のテンプレートとは[編集]

筆者が最も利用しているのが、図1のようなテンプレートです。これは2020年29週の分ですが、週毎の月日と曜日、リンクをつけただけの簡単なものです。

リスト1 「2020年29週」
[[週報:2020年28週|前週]] --- [[週報:2020年30週|次週]]

== 7/13(月) ==
== 7/14(火) ==
== 7/15(水) ==
== 7/16(木) ==
== 7/17(金) ==
== 7/18(土) ==
== 7/19(日) ==
<hr />
[[週報:2020年28週|前週]] --- [[週報:2020年30週|次週]]

リスト1のテンプレートは、実際には図1のように表示されます(月曜日の欄には既にリンクメモが付加されています)。こんな具合に、思いついたメモや当日得た情報をその日の欄に順不動で追加して行きます。

図1 週報の画面

MediaWikiの機能として上部に目次が追加されます。各小見出しにはid属性が付与されますので、外部からリンクすることが可能です。この辺りの基本機能はQiitaとほとんど同じです。

「編集」という青のリンクは、見出し以下の編集機能です。CMSの仲間であるQiitaと違って、各小見出し以下だけを(次の同レベル以上の小見出しまで[1])編集できるのが便利です。Qiitaは全文を編集しなければならないので長い記事は書きにくいのですが、MediaWikiは適当に小見出しを入れることにより編集画面を小さくできます。

最初は、リスト1を手書きで追加していたのですが、日付や曜日を調べるのが意外に面倒です。週番号を間違えたりすると、ややこしいことになってしまいます。そこで、テンプレートを自動作成することにしました。


必要条件[編集]

以下のアプリケーションを実行するためには

  • MediaWikiのデフォルト認証を使っている(PluggableAuthを使用していない)
  • 使用するユーザIDにページ作成権限がある


ことが必要です。PluggableAuthによる認証を使用している場合は、OAuth認証が必要になります。MediaWikiのAPIにおけるOAuth認証については、別記事にする予定です。


MediaWikiのAPI[編集]

MeidaWikiのAPIのドキュメントは、公式サイトのAPI:Main_page以下にあります[2]。コマンド名に相当するactionプロパティだけで120種類を越える膨大なAPI群です。但し、ここで使うactionは、

  • query
  • edit
  • clientlogin


の3種類だけですので、とても簡単です。


処理の流れ[編集]

全体的な処理の流れは図2のようになります。PHPの起動スクリプトはローカルサーバ上に置きます。ページがなければ自動的に作成します。最後にリダイレクトしますので、このURL(図2ではlocalhostの8081番ポートにアクセスしています)にアクセスすれば常にその週のページが表示されるので便利です。筆者はブラウザのホーム画面にしています。

図2 処理の流れ

PHPの起動スクリプトをリスト2に示します(例外処理等は省略しています。詳しくはGitHubをみてください)。経験のある方なら、クラスの名前だけで何をしているかおわかりになるでしょう。

リスト2
 1 // パラメータを得る
 2 $config = require_once 'config/ClientConfig.php';
 3 
 4 // get()とpost()の実装
 5 $client = new MwCurlClient($config);
 6 
 7 // APIに対するエージェント
 8 $agent = new MwAgent($client);
 9 
10 // ログイン
11 $agent->clientLogin(
12  	$config['username'],
13  	$config['password'],
14  	$config['url']
15  );
16 // $diff=0は今週をあらわす
17 $diff = isset($_GET['diff'])?$_GET['diff']:0;
18 
19 // タイトルは「20XX年:YY週」,YY=今週の週番号
20 $title = MwWeeklyReport::getTitle($diff);
21 if ($agent->existsPage($title) == false) {
22 	// ページが無いなら、あらかじめ作成する
23 	// 週番号に対するテンプレートを得る
24 	$text = MwWeeklyReport::getBlankPage($diff);
25 	$agent->createNewPage($title, $text);
26 }
27 
28 // 「20XX年:YY週」のページにリダイレクト
29 header('Location: ' . $agent->getUrl($config['url'], $title));


リスト2に登場するオブジェクトを次にあげます。

  1. ClientConfig: usernameなどのパラメータを格納する配列
  2. MwCurlClient: PHPのcurl関数群を使用してget()とpost()を実装する
  3. MwAgent: MediaWikiのAPIにアクセスする各種のメソッド
  4. MwWeeklyReport: リスト1でコンテンツマネージャと記したクラス。ページタイトルとテンプレートを作成する


以下では、MwAgentクラスの関連するメソッドについて説明します。


clientLogin()[編集]

MwAgentクラスのclientLoginメソッドをリスト3に示します。

「action=clientlogin」に必要なpostパラメータについてはclientloginの解説を参照してください。パラメータのうち「logintoken」は、事前に取得しておく必要があります[3]

実際には、ここで指定したパラメータに加えて「format=json」を指定する必要がありますが[4]、post()の実装のなかで付加していますので、リスト3では指定していません。

リスト3
101 public function clientLogin($user, $password, $rootUrl) {
102 	$token = $this->getLoginToken();
103 	$result = $this->client->post(array(
104 		'action' => 'clientlogin',
105 		'loginreturnurl' => $rootUrl,
106 		'username' => $user,
107 		'password' => $password,
108 		'logintoken' => $token
109 	));
110 	$status = $result['clientlogin']['status'];
111 	if ($status !== 'PASS') {
112 		throw new Exception("'clientlogin' failed. STATUS = " . $status);
113 	};
114 }


getLoginToken()[編集]

clientloginに必要なログイン用トークンはリスト4のように取得します。「action=query」はデータを取得するためのAPIです。指定するパラメータにより様々なデータが取得できます。「meta=tokens」は、セキュリティー上の理由で必要なトークンを取得するのため使用します。

clientLogin()と同様、ここで指定したパラメータに加えて「format=json」を指定する必要がありますが4、get()の実装のなかで付加していますので、リスト4で指定していません。以下も同様です。

リスト4
201 protected function getLoginToken() {
202 	$result = $this->client->get(array(
203 		'action' => 'query',
204 		'meta' => 'tokens',
205 		'type' => 'login'
206 	));
207 	return $result['query']['tokens']['logintoken'];
208 }


existsPage()[編集]

指定したタイトルを持つページが存在するかどうかを調べるだけのものです。これも「action=query」を使う問い合わせです。

リスト5
301 public function existsPage($title) {
302 	$result = $this->client->get(array(
303 		'action' => 'query',
304 		'titles' => $title
305 	));
306 	$pages = $result['query']['pages'];
307 	$id = array_keys($pages)[0];
308 	return $id >= 0;
309 }


createNewPage()[編集]

action=edit」を用いた操作です。

コンテンツマネージャ(MwWeeklyReport)から得たテンプレートを内容として、新たなページを作成します。ここではページ作成と呼んでいますが、編集の場合も全く同じ手順です(と言っても、編集操作はMediaWiki画面で行うのが通常です)。getCsrfToken()は、getLoginToken()から「type=login」を除いただけですので、省略します。

これまでの例では、get()でもpost()でも良かったのですが[5]、「action=edit」だけはpost()を使う必要があります。

リスト6
401 public function createNewPage($title, $text) {
402 	$token = $this->getCsrfToken();
403 	$result = $this->client->post(array(
404 		'action' => 'edit',
405 		'token' => $token,
406 		'title' => $title,
407 		'text' => $text
408 	));
409 	$status = $result['edit']['result'];
410 	if ($status != 'Success') {
411 		// 作成に失敗した
412 		throw new Exception("Failed to create new page.");
413 	}
414 }


あとがき[編集]

ローカルPCの起動スクリプトをサービスとして起動する場合の処理については、「PHPのビルトインウェブサーバをsystemdのサービスとして登録する」という記事にしました。ご参考に。


脚注[編集]

  1. MediaWikiの「Wiki markup言語」では、見出しを複数の「=」ではさみます。「=」の数が見出しのレベルで、2個の「=」で挟むとhtmlのh2に変換されます。Qiitaで使う「Markdown言語」では前置きの「#」に相当します。
  2. 残念ながら、日本語ページはあまり内容が伴っていないので、なるべく英語ページを参照してください
  3. あらかじめトークンを取得する必要があるのは、XSS対策のひとつです
  4. 最近では、結果をjsonでAPIにおける事実上の標準になっています。MediaWikiでも、「format=json」がデフォルト設定であるとドキュメントに書かれているのですが、v1.34.2では、まだそうはなっていないようです
  5. clientLogin()でpost()を使っているのは、セキュリティー上の理由です