グーグルデータサイエンスインタビューの質問:それをクラックするためにあなたが知る必要があるすべて



この記事では、Googleデータサイエンスの面接に関する一連の質問、面接プロセス、およびGoogleでの仕事に応募するための前提条件について説明します。

グーグルのような世界的に有名な会社に雇われることは、多くの人々にとって夢の仕事です。彼らには最も才能のあるAI研究科学者がいます。 そして 世界中。 Googleのソースは多くありません オンラインで質問を面接し、そこで就職するのは簡単ではありません。そのため、この記事では次のトピックについて説明します。

職務内容と要件

平均給与は $ 169,067 、ボーナスを含む。 Googleデータサイエンティストの給与は $ 120,000- $ 280,000 。この高い給料で、あなたはあなたが適用している仕事のための正しい要件を知る必要があります。要件は位置によって異なりますが、一般的な要件のいくつかを以下に示します。

最小要件:





文字列はJavaで可変または不変です

google

  • 定量的分野の修士号(統計学、オペレーションズリサーチ、コンピュータサイエンス)
  • データ分析関連分野での2年の実務経験
  • 統計ソフトウェアの経験(例: R 、 、MATLAB、Pandas)および
  • データベース言語の経験(例: SQL

責任:



Javaの可変および不変オブジェクト
  • 大規模で複雑なデータセットを処理します。必要に応じて高度な分析手法を適用して、困難で非日常的な分析の問題を解決します
  • データ収集と要件の仕様、処理、分析、継続的な成果物、およびプレゼンテーションを含む分析を実施します
  • 大規模な洞察を提供するために、分析パイプラインを繰り返し構築してプロトタイプを作成します
  • Googleのデータ構造と指標に関する包括的な知識を身に付け、製品開発に必要な変更を提唱します
  • 部門の枠を超えて相互作用し、ビジネスの推奨事項を作成します(費用便益、予測、実験分析など)
  • Googleのユーザー向け製品の品質を向上させるための分析、予測、最適化の方法を研究開発します

Googleデータサイエンスの面接プロセス

候補リストをクリアすること自体が難しい作業であり、それは完全にあなたに依存します CV、カバーレター そしてその 経験 。グーグル データサイエンス 面接の質問は、頭の体操と技術的な質問を組み合わせたものです。通常、最初のプロセスは電話インタビューです。

電話インタビュー:

それは主に基づいた質問で構成されています (具体的かつ理論的)そして大きく基づいている 。質問は、あなたが取り組んだプロジェクトによっても異なります。
  • ケース1: インタビューでは、特徴抽出手法、PCA(プロジェクトで使用)、相関分析、使用されたいくつかの分類手法(SVM、GBM、ニューラルネット)について質問されました。なぜロジスティック回帰ではないのか、なぜGBMなのか?-基本的に、クラスの分離可能性を中心に展開する質問。
  • ケース2: なぜ特徴選択を使用するのですか? 2つの予測子が高度に相関している場合、ロジスティック回帰の係数にどのような影響がありますか?係数の信頼区間はどれくらいですか?
  • ケース3: ディスクがスピンドル上で回転していて、ディスクが回転している方向がわかりません。ピンのセットが提供されます。ピンをどのように使用して、ディスクがどのように回転しているかを説明しますか?
電話インタビューの後、それは対面およびコーディングラウンドです。それでは、最も一般的なGoogleデータサイエンスの面接の質問のいくつかについて話し合いましょう。これらの質問は以下のように正確に尋ねられるとは限りませんが、私はそれらの多くをカバーしようとしました。

Googleデータサイエンスの面接の質問

これらの質問は困惑者ではありません。Googleは代わりにそれらの質問をするのをやめたので、彼らは彼らが呼ぶ同様の質問を持っています 問題解決の質問 。一般的なものから実用的なものまで、多くの機械学習の質問があります。グーグル 基本的に、深さではなくトピックの幅をカバーします。 Q1。 あなたはカジノにいて、2つのサイコロで遊ぶことができます。 5を出すたびに$ 10を獲得します。勝つまでプレイしてから停止した場合、予想される支払いはいくらですか。 Q2。 あなたはロンドン行きの飛行機に乗ろうとしています。傘を持っていく必要があるかどうかを知りたいのです。ランダムな友達3人に電話し、雨が降っている場合はそれぞれに電話します。あなたの友人が真実​​を語っている確率は2/3であり、彼らが嘘をついてあなたにいたずらをしている確率は1/3です。 3人全員が雨が降っていると言った場合、ロンドンで実際に雨が降っている確率はどのくらいですか。 Q3。 どのように新しいを追加しますか フェイスブック メンバーのデータベースへのメンバー、およびデータベース内の他のメンバーとの関係をコーディングしますか? Q4。 ユーザーの友達が増えた場合、6か月後にユーザーがアクティブでいる可能性が高くなることをどのようにテストしますか? Q5。 緑のカード10枚、赤のカード10枚、青のカード10枚、黄のカード10枚の4色のカードが40枚与えられます。各色のカードには1から10までの番号が付けられています。 2枚のカードがランダムに選ばれます。選んだカードが同じ数で同じ色ではない確率を調べます。 Q6。 さまざまなツイートを含むテキストファイルを読み取るために、選択した言語でプログラムを作成します。出力は2つのテキストファイルである必要があります。1つはすべてのツイートの中ですべての一意の単語のリストと繰り返し単語の数を含み、2番目のファイルはすべてのツイートの中で中程度の数の一意の単語を含む必要があります。 Q7。 データセットから欠落している値を削除するとバイアスが発生する場合はどうしますか? Q8。 ディスクがスピンドル上で回転していて、ディスクが回転している方向がわかりません。ピンのセットが提供されます。ピンをどのように使用して、ディスクがどのように回転しているかを説明しますか? Q9。 仕事のレコメンデーションエンジンをどのように設計しますか? Q10。 Googleでどのような製品を作りたいですか? Q11。 保険会社が私たちの運転状態を追跡できるように、車にはスピードトラッカーが埋め込まれています。この新しいスキームに基づいて、どのようなビジネス上の質問に答えることができますか? Q12。 1つのアルゴリズムが他のアルゴリズムよりも優れているかどうかをどのように判断できますか? Q13。 ボックスには、12枚の赤いカードと12枚の黒いカードがあります。別のボックスには、24枚の赤いカードと24枚の黒いカードがあります。 2つのボックスの1つからランダムに2枚のカードを引きたいのですが、同じ色のカードを入手する可能性が高いボックスとその理由を教えてください。 Q14。 袋詰めモデルとブーストモデルの違いは何ですか? Q15。 毎月ユーザーコンテンツのアップロードに関するレポートを作成していて、1月のアップロード数が急増しているのを観察しています。アップロードの増加は、特に画像のアップロードです。これの原因は何だと思いますか?また、この突然の急上昇をどのようにテストしますか? Q16。 あなたは衣料品企業を所有しており、市場での地位を向上させたいと考えています。地上からどうやってやるの? Q17。 2つのサージ価格設定アルゴリズムのどちらのバージョンが航空会社にとってより効果的であるかをどのように判断しますか? Q18。 投げ縄の自由度はどれくらいですか? Q19。 Pythonのイテレーター、ジェネレーター、リスト内包表記の違いは何ですか? Q20。 一連のWebページとWebサイトの変更を前提として、新しいWebサイト機能をどのようにテストして、変更が確実に機能するかを判断しますか? Q21。 各セルにアルファベットが含まれているMxN次元行列が与えられた場合、文字列が含まれているかどうかを調べます。 Q22。 ハッシュマップのような高度なデータ構造を使用して、キャッシュシステムをどのように構築しますか? Q23。 収集方法やリソースに関係なく、関心のあるトピックに関するデータセットを取得できるとしたら、データセットはどのようになり、どのように処理しますか? Q24。 異常検出方法とは何ですか? Q25。 キャッシングはどのように機能し、データサイエンスでどのように使用しますか?皆さん、これでこの記事は終わりです。 Googleデータサイエンスの面接の質問は主に シナリオベース そしてあなたが持っている必要があります 問題解決能力 さらに、これらの状況にデータサイエンスを適用する方法を知る必要があります。これにより、将来のデータサイエンスインタビューに備えるための展望が得られることを願っています。 Google、Microsoft、Apple、Uberなど。データサイエンスは広大であると同時に新しい分野であるため、すべての技術巨人は同様のタイプの質問をします。 データサイエンスの専門家が使用するツールとシステムに習熟します。統計、データサイエンス、Python、Apache Spark&Scala、Tensorflow、Tableauに関するトレーニングが含まれています。カリキュラムは、世界中の5000以上の職務記述書に関する広範な調査によって決定されています。ご不明な点がございましたら、下のコメント欄にご記入ください。