データ分析・攻略

出玉集計サイトの活用方法や注意点を考えてみた

どうも!

最近(2020/7月現在)の九州地方を中心とする豪雨は大変なことになっていますが、被害を受けられた方にはお見舞いを申し上げるとともに一日も早い復興を願っております。

地震や津波、火山の噴火が恐ろしいのはわかりますが、雨、ましてや台風という名が付いていないと心のどこかで軽んじてしまいがちですが、道路や線路が崩落してしまった映像を見て、自然の力の大きさを思い知るばかりです・・

さて今回は珍しくスロットの話を少し書いてみたいと思います。

といっても一般には関心の薄いであろう出玉集計サイトの話ですが・・・

データサイトの代名詞「サイトセブン」

以前から、ホールの旧イベント日の差枚数を集計して、強かった機種や末尾を発表したりといったいわゆる「晒し屋」という人たちがいましたが、昨今は一歩進んで、そうしたデータをウェブサイトで公開している「出玉サイト」も増えてきたように感じます。

ただそういうサイトは最近のことで、もともとパチンコスロットのデータサイトといえばサイトセブンが有名ですね。

サイトセブンはホールコンピュータのメーカーであるダイコク電機が運営しているサービスで、おそらくですが、ダイコクのホールコンを設置している店舗からダイコクのシステムに店舗の台データが送信されて、サイトセブンはそのデータを加工してサイトセブンの有料会員向けに公開しているのでしょう。

サイトセブン以外にもデータサイトは複数あり、マルハンのようにホール企業のオリジナルアプリだったり、またサイトセブン以外でも無料でデータ公開をしているサイトも複数あります。

これらに共通しているのは、あくまでネットでデータ公開をする前提で、ホール側の承諾のもとにデータを送信、公開している点で、データは各店舗のホールコンピュータから各データサイトの中央データベースに集められるという仕組みと考えられます。

↓ 参考記事 ↓

サイトセブンだけじゃない!無料でみれるデータロボサイトやアプリを一挙公開!

パチンコ・スロットのデータサイトで一番有名なのはサイトセブンですが、サイトセブン以外にもデータが見れるサイトがたくさんあるのをご存知ですか?しかも無料で見れるんです。 「サイトセブンで公開していないか ...

続きを見る

データサイトの弱点

データサイトのメリットはデータの正確さにあります。というかこれは当然といえば当然ですが・・・

データはホールコンピュータからデータサイトに直接送られてくると思われるので、何らかの意図やシステムの異常がない限りは、店が持っているのと同じデータがデータサイトの運営企業へ送信されていると考えられます。

稀に、ジャグラーなのにBIG40回なのにREGが0回とか、Aタイプなのにまっすぐマイナス5000枚といったおかしなデータもありますが、これは台からデータを送信する配線の問題とか、閉店後にたまたまその台を使って何らかの帳尻合わせをしていた痕跡と考えられます。

とはいえ上のようなケースは基本的には無視できる頻度のことなので、データサイトのデータはある程度信頼できると考えていいでしょう。

一方でデメリットもあります。それは、店舗にとって都合の悪いデータは公開されないという点です。

といっても、データを改竄したり隠蔽するわけではなく、データの見せ方を「工夫」することで、「不作為的」に見せたくないデータを見えにくくしています。

具体的には差枚数や出玉率がそうです。どのデータサイトも機種全体やホール全体の差枚数や出玉率を一目で見れるようにはしてくれません。

データサイトは各台のスランプグラフも公開しているので、それを見れば各台の差枚数を知ることはできますし、イン枚数やアウト枚数と呼ばれる稼働量もスランプグラフから読み取れるので、出玉率も計算することは可能です。

そして個別の台のデータは見れるということは、その気になれば全台のデータを集計することも可能です。

ただそれを手作業でやるとなると想像を絶する手間がかかります。月イチの旧イベ日くらいならばまだ耐えられますが、これを毎日やるとなるともはや正気の沙汰ではありません。

出玉集計サイト?

別に最近の出来事ではないのかもしれませんが、最近ネットでパチスロ関連のサイトを見ていたら、ホール全体の差枚数などを集計して公表しているサイトが複数あることを知りました。

具体名は差し控えますが、こうしたサイトにはかなりの店舗数のデータが掲載されていて、自分の地域を見るとほぼ全てのホールが網羅されていて、「こ、これは!」と思いました。

こうしたサイトは、プログラムを使ってデータを収集、保存しているのでしょう。これも詳細は控えますが、僕自身も自分の地域のホールのデータに関しては今でもずっと蓄積をしているので、それと比較してみました。

すると、ほとんどのデータにおいて、データ集計サイトと自分の手持ちのデータが大幅に異なることがわかりました。

たとえば、ある旧イベント日に、僕のデータでは約12000枚のプラス差枚(客側のプラス)ですが、あるサイトでは5万枚を超えるプラス差枚となっていました。

12000枚でも5万枚でもお店が頑張ってくれたことには変わりませんが、これはかなり大きな違いだと思います。この原因はおそらく、

  • バラエティなどの少数台数を除外した
  • 結果が芳しくなかった機種を意図的に除外した

のかと思われます。

さらには、その翌日にこの店はマイナス12万枚の鬼回収をしたのですが、この出玉サイトにはその日の集計すらありません。

放出日のデータだけ公開して、回収日のデータはみせず、さらにその数値の信憑性も微妙となると、そうしたサイトは攻略ツールとしての価値はほとんどないのかもしれません。

ただ全く使えないということでもなく、旧イベント日の全体の差枚だけを見て「うぉぉ!優良店発見!」となるのではなく、できれば強かった機種などがわかるデータを見て、「前回はまど2だったから次は除外だな」みたいに、次回の全台系の予測とかに役立てるのがいいかもしれません。

出玉集計サイトの目的・利害関係

データ集計サイトはどのような目的を持ってサイトを運営しているのかを考えてみると、やはりアクセスを集めてからの広告収入という流れが一般的なのでしょう。広告もグーグルのようなものから、パチンコ店などに直接営業をかけて、ということもあるかもしれません。

「業界の活性化」とか「パチンコが好き!」みたいな思いもあるのかもしれませんが、データ集計という泥臭いことをやるからには、収益という見返りを求めるのは当然だと思います。収益が不要であれば、今この文字を書いている誰かみたいにサボりながら意味不明なことを書き散らかしてもいいわけですからねw

ただ、出玉集計サイトはホールやデータサイトの運営企業と利害が対立しては生きていけないと思います。そもそも元のデータは、データサイトから抽出したものですし。

ただデータを吸い出して自分のサイトに複製して見せるような見せ方では、オリジナルのデータサイトの利益を侵害してしまう。

また、1日で12万枚回収していたとか、この機種はベタピン放置とか、そういう真実を可視化してしまうと、今度はホールの利益を侵害してしまう。。。

ホールがデータサイトに「最近、集計サイトの野郎がウザいから全部ブロックしてくれ!」と不満を漏らせば、ホールとデータサイトを同時に敵に回してしまいます。

となると結局、データ収集サイトはホールやデータサイトの意向に逆らうことはできず、当たり障りのないホールのとって都合がいいデータにならざるを得ない、と考えてしまいます。

ここで攻めの姿勢でホールの回収度合いを暴いてみせたとしても誰も喜ばないでしょうし。

スクレイピングは適度に楽しむ遊びです

またこのデータを取得するテクニックは「スクレイピング」と呼ばれるもので、「クローラー」とか「ボット」と呼ばれるコンピュータのプログラムにデータを収集させるものです。

というとなんか怪しい響きですが、スクレイピング自体は一般的には合法的な行為と考えられていて、オンラインショップの競合店舗の価格調査をしたり、人材紹介会社の求人情報を抽出したり、ニュースなどの記事を抽出したりと、さまざまな業種で一般的に使われている手法でもあります。

そもそも、インターネットを牛耳るグーグル様自体がクローラーを走らせまくって世界中のサイトからデータを抽出しているわけですからね。

ただし過去にはスクレイピングで逮捕された事例もあります(岡崎市立中央図書館事件)。

ここではスクレイピング自体というよりも、その方法に問題があったようで、相手のシステムに極端なまでの負荷をかけたことが問題視されたようです。その線引きは曖昧ですが、相手がスクレイピングによって不利益を受けたと思えば偽計業務妨害に問われかねません。

なのでインターネットの世界にはクロールに関する規約もあって、それに準拠しているかどうか、利用規約での記載なども判断の材料になるとのことです。

データ集計サイトは相当数のホールのデータを収集しているので、場合によっては上述のような面倒に巻き込まれないともいえません。となると、ますますもってデータサイトやホールと利害が対立したらやっていけません。

例えばサイトセブンなどは明確に利用規約で「プログラムを使ってアクセスすんなよ」と書いているので、ことが起きた場合にはやったほうが不利になりかねません。

これは余計なお節介ですが、スクレイピングをする際は、利用規約を読み、robots.txtを遵守して、そして相手側のシステムに負荷をかけず、なるべく目立たないようにデータを収集していただきたいと思います。

例えばインターバルを開けずにリクエストを送信しまくると、サーバーは過負荷になるかもしれません。本来ならばサーバー側で帯域を調整したり、クローラーからの接続を拒否するべきなのですが、そういう設定をしていないシステムも多くあります。しかしその場合でも、「管理者がヘボだからいけないんだ」は通用せず、負荷をかけた側が業務妨害をしたと訴えられるかもしれません。

せめて1秒に1リクエスト以下とか、かなり頻度を下げるべきだと思います。またkeep-alive等の指示がある場合はそれを遵守してリソースを最小限に抑えるべきでしょう。

「いやそんなお行儀よくしてたら毎日多数のホールのデータを収集できない」というのならば、それはもしかすると最初から「スジが悪い」アイディアだったのかもしれません・・・

そういったことを守った上でホールも気に入ってくれるような集計サイトならば、データサイト側も無碍にできなくなる可能性も少しアップするでしょうし(無碍にしないとはいっていない…)。

 

ただスクレイピング自体はデータサイト以外の分野でも役に立つテクニックですし、他の人が手作業で集めているデータを自動で自分好みのフォーマットにしてデータベースにぶち込み、それをさらにレポーティングツールで可視化した時の優越感などは何物にも替えがたいので、興味がある方は勉強してみると面白いかもしれません(興味がある方は少ないかと思いますが)・・・そのデータをさらにAIに学習させようと野望に燃えて本を買ったのですが、AIの世界は数学がモノをいう世界で、目に見えるものしか理解できない文系ITドカタの僕には敷居が高すぎて挫折・放置したままです。

最後にこれまた余計なお世話ですが、こういう知識やスキルを身につけるとそれだけでちょっとしたアルバイトや副業もできそうな感じでしたし、そうでなくても自分の仕事で役立つかもしれません。今は仕事はしてなくてなんとなく将来に不安がある方や、やりたいことが分からない人は、こういう身近なところから手をつけてプログラミングを覚えてみるのも面白いかもしれません。プログラムはネットとパソコンさえあれば誰でも無料で勉強できるので、生まれや学歴、親の財力も関係ないですし、場所を選ばずに仕事ができるというのはこれからの時代には大きな魅力だと思います。

-データ分析・攻略