波紋を広げるFedoraの利用統計

この1月、Fedoraは、重複を除いてIPアドレスをモニターするトラッキング・ツールで利用者数を計測した結果、Fedora Core 6のユーザー数が100万を超えたと発表した。この利用統計は、Fedoraの今後のリリースにとって、どのような意味を持つのだろうか。そして、Linuxコミュニティー全体にとっては? その答えは、どちらも、実り多いものになりそうだ。

従来、Fedora Coreには利用統計がなく、パッケージの評価を知るのは困難だった。昨年11月に開催されたFedora Summitなどもあるが、そうした限定的な集まりでは、次期リリース計画を立てるための情報は得られても、リリースされたディストリビューションの当否については分からない。そこで、Fedoraは、Fedora Core 6(FC6)のリリースに際して利用データを収集することにした。Fedoraのプロジェクト・リーダーMax Spevackによると、Fedoraコミュニティーに仕える立場のチームにとって、最良の道はコミュニティーが求めていることを知り、それを提供すること。そして、利用統計は、チームが行った活動の成否や課題を明らかにする上で役に立つという。

データの収集法

FC6のリリースが近づくにつれ、チームでは、統計情報があればFedoraの利用についてもっと多くのことが分かるのにと考えるようになった。それでは、どのようなデータをどのような方法で収集すべきだろうか、チームはユーザー・コミュニティーの助けを借りた。Fedora Metrics wikiには、アンケートやユーザー登録などといった方法から、利用者に関するデータをサーバーに送るファイルをパッケージに組み込む方法まで、多様な提案がある。もちろん、チームにとってもユーザー・コミュニティーにとっても、最優先課題はプライバシーだ。侵襲的で狡猾なデータ収集法が検討されることはない。

これについて、Fedoraでインフラストラクチャーを担当する新任リーダーMike McGrathは次のように述べている。「いろいろな方法が論じられていました。中には、UUIDを登録するという極めて侵襲的な案までありました。しかし、あくどいことはしたくありませんから、個人名を出さずに匿名でデータを送れるような方法にするつもりです。データからコンピューターや利用者を特定できるのは、当人自身が識別情報を教え『サウンドが機能しない、プロファイルは3333-44-2-22322223424だ』と言った場合だけです」

当時、Fedoraインフラストラクチャーの一部で、オープンソースのデータ収集グラフ化ツールCactiが使われていた。そのため、自然な成り行きとして、FC6のリリースでもCactiを使おうということになった。インフラストラクチャー・チームのメンバー数名が協力してCactiの設定・実装に当たり、精力的に取り組んだ結果、FC6のリリースまでに準備を整えることができた。なお、その際の作業については文書化されておらず、そのほとんどは「インフラストラクチャー・メンバーの頭の中」(Spevack)にあるが、同様の作業の参考として聞きたいことがあれば遠慮なく同チームに尋ねてほしいとSpevackは述べている。

Cactiは、FC6を新たにインストールしアップデートを検索するためにyumに接続したIPアドレスを重複を除いて計数する。狙いは、IPアドレスの重複を除くことだ。McGrathによると、まだ決まってはいないものの、次期Fedora Core 7(FC7)のリリースでは他の情報も収集されるという。

Spevackによると、単にディストリビューションがダウンロードされた回数を数えるだけでは不十分で、将来のリリースで取り上げるべきことを決める際に参考になるデータを収集することが重要だ。バグ報告の多いパッケージやインストール頻度の高いものなどが分かれば、ユーザー・コミュニティーがFedoraのどこを気に入り、どこを嫌っているのかがより明確になるという。

FC6のリリースで収集された情報は必要最小限のものだけだったが、チームでは、年内に予定されるFC7のリリースでは収集するデータを大幅に増やしたいと考えている。Spevackはmetrics collected from FC6の中で、「どのような結果になっても必ず開示します。よい数字であれば結構なこと。そうでなくても、利用統計を入手したわけですから、それから改善すべき点が分かります」と述べている。

「統計は、ソフトウェアの使われ方を見るための手段に過ぎません。それが示すFedoraの使われ方がどうあれ、意思決定の改善には役立ちます」

今回Fedoraのデータ収集から得られた利用統計は、開発者の自慢の種になるだけではない。コンピューターを使用する現場でLinuxの利用が増えていることをも示している。これは、さらに、ハードウェア・ベンダーに対して、Linux向けにさらに多くの製品やサービスを提供するよう促すことにも繋がる。

「Linuxの利用が広がっていることを示す客観的なデータであり、Linux全体にとって有利な材料です。私たちはハードウェア・ベンダーがより多くの(Linux向け)ドライバーを作ってくれるよう繰り返し言ってきましたが、これからは、ベンダーのところに行って『数百万の人々が使っているんだ』と言うことができます。そうすれば彼らも耳を傾けてくれるでしょう。実社会では、データで根拠を示す必要があります。そのデータが手に入ったということです」(Spevack)

Red HatもFedoraもベンダーの説得にこの数字を利用してはいないが、Red Hatは現在もLinux対応を続けるようベンダーに促しており、「Fedoraの数字が(Red Hatの)矢筒に新たな矢を加えることになれば素晴らしいことです」とSpevackは言う。

よりよいソフトウェアはよりよい統計から

最終的にどのような方法でどのようなデータを収集するかが決まるのはまだ数週間先のことだが、McGrathによると、エンドユーザーの名が必ず出るようなことにはならないだろうという。「セキュリティーに関心の高い利用者は名を出さないでしょう。そういう人たちは少数でしょうが、発言力は大きいですから」。そして、きちんとした目的と目標があればほとんどの人々はデータの収集に協力的だが、行き当たりばったりで意味のないデータ収集は嫌われると言う。

Spevackと同様、McGrathも、詳細なデータ収集はFedoraパッケージの改善に繋がると言う。さらに、ハードウェア・ベースのデータを収集するだけでなく、「利用者に尋ねなくてもパッケージの使い道が分かるような調査法がほしいですね。将来は、パッケージ・リストも集めたいと思います。人気のあるパッケージや使われないパッケージが分かりますから」

チームでは、FC7のリリースではさらに詳細なデータを収集したいとしているが、今はまだ、現行のデータ収集法について拡張を論じているところだ。使用するデータ収集ツールについてもやるべきことが残っている。しかし、時間はまだ十分にあり、4月のリリースには間に合うとチームでは考えている。Spevack個人としては、収集したデータは公開し、コミュニティーの意見を聞きたいと考えている。McGrathも同意見で、他のソフトウェア・ベンダーも同様の情報を集め公開してほしいと言う。「私の知る限り、インストール・ベースの大きさや人気アーキテクチャーなどを発表しても、その数字を推定した方法について実質的に開示しているところはありません。困ったことです」

NewsForge.com 原文