OLTPとOLAP



次のブログでは、OLTPとOLAP、およびさまざまなユースケースについて簡単に説明しています。

OLTPとOLAP

OLTPは、ユーザーがデータストアを使用して多くのオンライントランザクションを実行する、オンライントランザクションシステムまたはデータストレージシステムのようなものであると言われています。また、リアルタイムでアドホックな読み取り/書き込みが行われると言われています。





フィボナッチ再帰C ++

OLAPは、オフラインデータストアのようなものです。アクセスされます何度かオフラインで。たとえば、バルクログファイルが読み取られてから、データファイルに書き戻されます。 OLAPが使用される一般的な領域には、ログジョブ、データマイニングジョブなどがあります。

CassandraはリアルタイムであるためOLTPに近いと言われていますが、Hadoopは分析と一括書き込みに使用されるためOLAPに近いと言われています。



なぜOLAPとOLTPを統合するのですか?

今後365日以内にホテルを予約するための最も安い価格を探している場合、ここにCassandraの膨大なデータセットがあり、リアルタイムデータベースで推奨を行いたい場合は、価格に基づいてプロモーションが実行されます。

このようなシナリオでは、すべてのレコードを繰り返し、その上に分析を維持する必要があります。これは、頻繁にキックスタートする必要がある巨大なオフラインジョブです。ここで、Hadoopがバルクデータクランチに役立ちます。

もう1つの利点は、1つのクラスターを実行し、別のHadoopクラスターの実行を中止できることです。



3つ目のメリットは、運用コストも大幅に削減できることです。

ユーザーがHive、Pig LatinなどのさまざまなHadoopエコシステムに精通していて、データを統合する必要があるシナリオを考えると、CassandraにデータソースをプラグインしてMapを実行する必要があります。仕事も減らしてください。

OLTPとOLAPの間には顕著なパターンがあります。 OLTPでは、書き込みの数が少なくなります。ホテル情報。価格の変更が1秒あたり5000回ごとに発生すると仮定すると、読み取りはここでさらに多くなる可能性があります。このようなシナリオでは、1秒あたり1回の書き込みが発生する可能性がありますが、読み取りは数百、数千に達する可能性があります。したがって、ここでの比率は約1:1000です。

Cassandraがこのモデルに簡単に適合できることは興味深い観察です。このモデルには、読み取り/書き込みが等しいモデルが含まれます。また、OLTPに関しては、調整可能で強力な整合性モデルに入ったとしても、結果整合性モデルと最強の整合性モデルの間にミリ秒のギャップが見られます。したがって、CassandraはOLTPに適合できます。

OLAPを使用すると、さまざまなOLAPパターンを確認できます。つまり、複数の書き込みが同時に発生します。 OLAPでは、データを1回でダンプします。つまり、すべてのログファイルをデータストアに入れてから、処理を開始します。データパターンまたはアクセスパターンは、OLTPの種類のアプリケーションとは正反対です。ここでは、HadoopまたはMapReduceが役立ちます。

質問がありますか?コメントセクションでそれらに言及してください。折り返しご連絡いたします。

関連記事:

sqlおよびplsqlチュートリアル

Cassandraを学ぶ5つの理由