たれみみの備忘録

たれみみの備忘録です。仕事と酒がメインになりそう。

SR の対応事項

お客さんからのアーキテクチャ相談で迷ったので、中の人に聞いてみた。

結果、SR はアーキテクチャの相談とかは承っていないみたい。
SR の対応範囲をあたくしがよく分かっていなかった。反省。

アーキテクチャ相談などはプレミアサポート内のプロアクティブメニュー(有償)で可能。
MS のエンジニアとディスカッションしたり、MS のエンジニアにてレビューをするという支援自体はしてもらえる。
※スコープ・工数によるけど。


以下、質問と回答。
回答対象ではないのに丁寧に回答してもらったので、ほぼ原文ママ
お客さんの情報があったからだいぶ端折ってるけど、構成図とか作って説明してた。


<質問内容>

お客様より、Azure Data Lake Gen2 にデータを溜めて、そのデータを API 経由で取得したいという相談がありました。
お客様的には、BI 側で全データを持っているため、DWH は持ちたくないようです。
上記の条件において、Azure Data Lake Gen2 の利用方法として正しいアーキテクチャとなりますでしょうか。
また、上記の条件において、懸念点等はありますでしょうか。

<回答>

大変恐れ入りますが、弊社サポート部門ではシステムのアーキテクチャ案についての妥当性については、個別の SR より回答させていただくことは出来かねます。
具体的にどの部分の確認がしたい、また、こういったことをやってみたがエラーが出て実現したいことができないなど、トラブルシューティングをメインにご支援させていただいております。
そのため、本ケースに関しましても、現時点で頂いている情報について、ドキュメントベースでの一般的な回答となること、ご了承いただけると幸いです。

まず、ADLS Gen2 はディレクトリ管理系のオペレーションのパフォーマンスが Blob ストレージに比べて優れています。
そのため、ファイルシステムのように扱うようなユースケースの場合(時系列データを格納する場合など)や、フォルダーレベルでアクセス権限を付与したい場合などは、ADLS Gen2 が選択肢となります。
【参考:Azure Data Lake Storage Gen2 の使用に関するベスト プラクティス

Data Lake Storage Gen2 に特化したパフォーマンスに関する公開ドキュメントは御座いませんが、Premium SKU の Data Lake Storage Gen2 については、Premium SKU ブロック Blob と同様に、最適化されたソリッドステートドライブ(SSD)に格納されるため、 同等のパフォーマンスメリットを享受することが可能です。
以下のドキュメントに Premium SKU のパフォーマンスの記載が御座いますので、ご確認いただけると幸いです。
API 実行頻度によるシステムへの影響については、実際のリクエスト量やどのような操作をするかに依存する部分のため、下記の内容をご確認いただいた上で、お客様にて検証いただければと存じます。
【参考:Premium ブロック BLOB ストレージ アカウント

トランザクション料金についてですが、以下のドキュメントの「操作とデータ転送」の項目に、操作ごとのコストについての記載がございます。
そのため、まずはどの操作をどの程度利用するかなどの具体的なユースケースを立てていただいた上で、ご検討いただくのが良いかと存じます。
【参考:Azure Blob Storage の価格

最後に、アーキテクチャーセンターというドキュメントがございますので、Azure 上でのアーキテクチャー選定をする際のご参考にしていただければと存じます。
【参考:Azure アーキテクチャを参照する



うーん、結局どうなんだろう? やったことないから、想定がつかないわ。
アーキテクチャセンターにも、そんなん無かったし。あたくしだって最初にそこ見たわ。
もちろん API コールの頻度にもよるけど、イメージ的には「API で共有フォルダをつつきに行く」って感じで、ADLS Gen2 のパフォーマンス出ない気がするんよね。。。
あと、ADLS Gen2 のランニングコストかかりそう。
データ読み出しにも金かかるしねぇ~。