質問 1:データエンジニアが、複数のタスクを含むジョブを毎晩実行しています。クラスターの起動に時間がかかるため、各タスクの実行速度が遅くなっています。
ジョブに使用されるクラスターの起動時間を改善するために、データ エンジニアが実行できるアクションは次のどれですか。
A. 汎用クラスタの代わりにジョブクラスタを使用できる
B. より大きなデータサイズに合わせてクラスタを自動スケールするように構成できます。
C. クラスタを単一ノードとして構成できる
D. クラスタープールのクラスターを使用できる
E. Databricks SQLで利用可能なエンドポイントを使用できる
正解:D
解説: (Topexam メンバーにのみ表示されます)
質問 2:データエンジニアは、いくつかのテーブルからデータエンティティを作成したいと考えています。このデータエンティティは、他のセッションの他のデータエンジニアによって使用される必要があり、物理的な場所に保存する必要があります。
データ エンジニアが作成する必要があるデータ エンティティは次のどれですか。
A. 表示
B. 一時ビュー
C. データベース
D. 関数
E. テーブル
正解:E
解説: (Topexam メンバーにのみ表示されます)
質問 3:Structured Streaming が処理の正確な進行状況を確実に追跡し、再起動や再処理によってあらゆる種類の障害に対処できるようにするには、Spark が各トリガーで処理されるデータのオフセット範囲を記録するために使用する次の 2 つのアプローチのどちらですか。
A. 先行書き込みログとべき等シンク
B. チェックポイントとべき等シンク
C. 構造化ストリーミングでは、各トリガーで処理されるデータのオフセット範囲を記録できません。
D. 再生可能なソースとべき等なシンク
E. チェックポイントと先行書き込みログ
正解:E
解説: (Topexam メンバーにのみ表示されます)
質問 4:Delta Live Table パイプラインには、STREAMING LIVE TABLE を使用して定義された 2 つのデータセットが含まれます。LIVE TABLE を使用して Delta Lake テーブル ソースに対して 3 つのデータセットが定義されています。
テーブルは、継続パイプライン モードを使用してプロダクション モードで実行されるように構成されています。
以前に処理されていないデータが存在し、すべての定義が有効であると仮定すると、[開始] をクリックしてパイプラインを更新した後の予想される結果は何ですか?
A. すべてのデータセットが一度更新され、パイプラインがシャットダウンされます。コンピューティングリソースは終了します。
B. すべてのデータセットは一度更新され、パイプラインは処理されずに保持されます。コンピューティングリソースは保持されますが、使用されません。
C. パイプラインがシャットダウンされるまで、すべてのデータセットは設定された間隔で更新されます。コンピューティングリソースは更新のためにデプロイされ、パイプラインが停止すると終了します。
D. すべてのデータセットが一度更新され、パイプラインはシャットダウンされます。コンピューティングリソースは、追加のテストのために保持されます。
E. パイプラインがシャットダウンされるまで、すべてのデータセットは設定された間隔で更新されます。コンピューティングリソースは、追加のテストを可能にするために保持されます。
正解:C
解説: (Topexam メンバーにのみ表示されます)
質問 5:データ エンジニアは次のコマンドを使用して新しいデータベースを作成しました。
customer360 が存在しない場合はデータベースを作成します。
customer360 データベースは次のどの場所に配置されますか?
A. dbfs:/user/hive/database/customer360
B. dbfs:/user/hive/warehouse
C. 正しい応答を決定するには、さらに情報が必要です
D. dbfs:/user/hive/customer360
正解:B
解説: (Topexam メンバーにのみ表示されます)
質問 6:テーブルを長い形式から広い形式に変換するにはどの SQL キーワードを使用できますか?
A. 変換
B. 変換
C. ピボット
D. 合計
正解:C
質問 7:Auto Loader がデータを増分処理するために使用するツールはどれですか?
A. データブリックスSQL
B. チェックポイント
C. Unity カタログ
D. Spark構造化ストリーミング
正解:D
解説: (Topexam メンバーにのみ表示されます)
質問 8:ワークフローがスケジュールどおりにトリガーされるようにするには、データ エンジニアはどの方法を適用する必要がありますか?
A. スケジュールされたワークフローでは、クラスターがパイプラインを実行するのに十分な時間だけ実行されるため、リソースの消費と費用を削減できます。
B. スケジュールされたワークフローでは常時実行されるクラスターが必要です。これはコストは高くなりますが、処理の遅延は短縮されます。
C. スケジュールされたワークフローは、構成されたソースにデータが到着するとそれを処理します。
D. スケジュールされたワークフローは、手動で停止されるまで継続的に実行されます。
正解:A
質問 9:データ エンジニアは、組織の既存の SQLite データベースのデータを使用して、Databricks にテーブルを作成する必要があります。
次のコマンドを実行します。

次のコード行のうち、上記の空白を埋めてタスクを正常に完了するものはどれですか?
A. sqlite
B. デルタ
C. オートローダー
D. org.apache.spark.sql.sqlite
E. org.apache.spark.sql.jdbc
正解:A
解説: (Topexam メンバーにのみ表示されます)
TopExamは君にDatabricks-Certified-Data-Engineer-Associate日本語の問題集を提供して、あなたの試験への復習にヘルプを提供して、君に難しい専門知識を楽に勉強させます。TopExamは君の試験への合格を期待しています。
弊社のDatabricks Databricks-Certified-Data-Engineer-Associate日本語を利用すれば試験に合格できます
弊社のDatabricks Databricks-Certified-Data-Engineer-Associate日本語は専門家たちが長年の経験を通して最新のシラバスに従って研究し出した勉強資料です。弊社はDatabricks-Certified-Data-Engineer-Associate日本語問題集の質問と答えが間違いないのを保証いたします。

この問題集は過去のデータから分析して作成されて、カバー率が高くて、受験者としてのあなたを助けて時間とお金を節約して試験に合格する通過率を高めます。我々の問題集は的中率が高くて、100%の合格率を保証します。我々の高質量のDatabricks Databricks-Certified-Data-Engineer-Associate日本語を利用すれば、君は一回で試験に合格できます。
弊社は無料Databricks Databricks-Certified-Data-Engineer-Associate日本語サンプルを提供します
お客様は問題集を購入する時、問題集の質量を心配するかもしれませんが、我々はこのことを解決するために、お客様に無料Databricks-Certified-Data-Engineer-Associate日本語サンプルを提供いたします。そうすると、お客様は購入する前にサンプルをダウンロードしてやってみることができます。君はこのDatabricks-Certified-Data-Engineer-Associate日本語問題集は自分に適するかどうか判断して購入を決めることができます。
Databricks-Certified-Data-Engineer-Associate日本語試験ツール:あなたの訓練に便利をもたらすために、あなたは自分のペースによって複数のパソコンで設置できます。
弊社は失敗したら全額で返金することを承諾します
我々は弊社のDatabricks-Certified-Data-Engineer-Associate日本語問題集に自信を持っていますから、試験に失敗したら返金する承諾をします。我々のDatabricks Databricks-Certified-Data-Engineer-Associate日本語を利用して君は試験に合格できると信じています。もし試験に失敗したら、我々は君の支払ったお金を君に全額で返して、君の試験の失敗する経済損失を減少します。
一年間の無料更新サービスを提供します
君が弊社のDatabricks Databricks-Certified-Data-Engineer-Associate日本語をご購入になってから、我々の承諾する一年間の更新サービスが無料で得られています。弊社の専門家たちは毎日更新状態を検査していますから、この一年間、更新されたら、弊社は更新されたDatabricks Databricks-Certified-Data-Engineer-Associate日本語をお客様のメールアドレスにお送りいたします。だから、お客様はいつもタイムリーに更新の通知を受けることができます。我々は購入した一年間でお客様がずっと最新版のDatabricks Databricks-Certified-Data-Engineer-Associate日本語を持っていることを保証します。
安全的な支払方式を利用しています
Credit Cardは今まで全世界の一番安全の支払方式です。少数の手続きの費用かかる必要がありますとはいえ、保障があります。お客様の利益を保障するために、弊社のDatabricks-Certified-Data-Engineer-Associate日本語問題集は全部Credit Cardで支払われることができます。
領収書について:社名入りの領収書が必要な場合、メールで社名に記入していただき送信してください。弊社はPDF版の領収書を提供いたします。
Databricks Databricks-Certified-Data-Engineer-Associate日本語 認定試験の出題範囲:
トピック | 出題範囲 |
---|
トピック 1 | - Incremental Data Processing: In this topic questions about identifying Delta Lake, benefits of ACID transactions, a scenario to use an external table, location of a table, the benefits of Zordering, the kind of files, CTAS as a solution, the impact of ON VIOLATION DROP ROW and ON VIOLATION FAIL UPDATE, and the necessary component to create a new DLT pipeline. Moreover, the topic also discusses directory structure of Delta Lake files, generated column, adding a table comment, and the benefits of the MERGE command.
|
トピック 2 | - Databricks Lakehouse Platform: This topic covers the relationship between the data lakehouse and the data warehouse, the improvement in data quality, comparing and contrasting silver and gold tables, elements of the Databricks Platform Architecture, and differentiating between all-purpose clusters and jobs clusters. Moreover, it identifies how cluster software is versioned, how clusters can be filtered, how to use multiple languages, how to run one notebook, how notebooks can be shared, Git operations, and limitations in Databricks Notebooks. Lastly, the topic describes how clusters are terminated, how to use multiple languages, and how Databricks Repos enables CI
- CD workflows.
|
トピック 3 | - Data Governance: It identifies one of the four areas of data governance, Unity Catalog securables, and the cluster security modes. It also discusses how to create a UC-enabled all-purpose cluster and a DBSQL warehouse. The topic explains how to implement data object access control, create a DBSQL warehouse, and e a UC-enabled all-purpose cluster.
|
トピック 4 | - ELT with Apache Spark: It focuses on extracting data, identifying the prefix, creating a view, duplicating rows, creating a new table, utilizing the dot, parsing JSON, and defining a SQL UDF. Moreover, the topic delves into describing the security model, identifying the location of a function, and identifying the PIVOT.
|
トピック 5 | - Production Pipelines: It focuses on identifying the advantages of using multiple tasks in Jobs, a suitable scenario where predecessor task should be set up, CRON as an opportunity for scheduling opportunity, and how an alert can be sent via email. The topic also discusses setting up a predecessor task in Jobs, reviewing a task's execution history, and debugging a failed task. Lastly, it delves into setting up a retry policy in case of failure and creating an alert in the case of a failed task.
|
参照:https://www.databricks.com/learn/certification/data-engineer-associate