Jul 04, 2023
データ サイエンスのキャリアを損なう可能性がある、避けるべき 10 の致命的な間違い
Divyanshi kulkarni DataDrivenInvestor をフォロー -- 聞く シェアする ビジネスにとってのデータは、体にとっての血液と同じです。 そして、今日の慌ただしい世界において重要なのは、データから何を作るかだけです。 それはただ
ディヴィャンシ・クルカルニ
フォローする
データドリブン投資家
--
聞く
共有
ビジネスにとってのデータは、身体にとっての血液と同じです。 そして、今日の慌ただしい世界において重要なのは、データから何を作るかだけです。 それは単なるデータですが、人工知能が組み込まれています。 それをより力強く、影響力のあるものにするのです。 データが多種多様であるため、大量の匿名性が得られ、不適切や間違いが生じることはほとんどありません。
ExplodingTopics.com の最近の統計を理解し始めると、毎日約 3 億 2,877 万テラバイトのデータが生成されていることがわかります。 2025 年には、約 181 ゼタバイトのデータが生成されると予測されています。 データ生成の現場では非常に多くのことが起こっているため、計算ミスやミスが発生する可能性は十分にあります。 これらは今後のビジネスに多大なコストをもたらす可能性があるため、最初の段階でこれらに対処することが重要です。
間違い 1: ビジネス上の問題を正確に定義する能力がない
当面のビジネス データの問題を定義することが最も重要です。 それがビジネスの見通しの方向性を決定することになるからです。 データ サイエンスのキャリアの初期段階にある初心者のデータ サイエンス専門家 、データサイエンスのこの重要な側面を重視することを忘れてください。 データ サイエンスが各ステップで何をもたらすかについて明確なビジョンを持つためには、プロジェクトの可能性を最初から最大限に検討することが非常に重要です。 このため、ビジネス要件を常に理解することが重要です。
間違い 2: 調査と計画の欠如
データ サイエンティストが避けなければならないもう 1 つの間違いは、十分なデータを収集しないこと、十分な調査を行わないこと、ビジネス上の問題に対する具体的な計画が欠けていることです。 研究課題に正確に答えるために十分なデータを所有することが重要です。 十分なデータがないと、分析から信頼できる結論を推測したり導き出すことができません。 次のような質問に対処します: 答えようとしている質問は何ですか? それらの質問にどのように答えますか? データが特定の動作をするのはなぜですか? それは私たちにどんな物語を伝えようとしているのでしょうか? 強く提案されています。 対策計画を立てずに問題に直接遭遇すると、ビジネスに多大なコストがかかる可能性があります。
間違い 3: 不適切なデータ視覚化方法の選択
問題をさらに深く掘り下げる計画を立てる場合、クリーニングと前処理が最初のステップとなります。 データ視覚化の正しい選択を行う成功にはテクニックやその他のツールが不可欠です。 これらは、プロジェクト開発のすべての段階で不可欠であると考えられます。 悪い視覚化または誤った視覚化は、あなたを誤った方向に導く可能性があります。 最終的なビジネス目標から逸脱します。
間違い 4: 効率的なモデルのフィッティングに失敗する
適切な機械学習モデルのデプロイと利用に失敗すると、重大な危険信号が発生します。 所有するデータに合わせてモデルを最適化することが最も重要です。 データは時間の経過とともに変化し進化するため、ピークのパフォーマンスに到達するには、ハイパーパラメーターの値をタイムリーに変更し、最適化する必要があります。
間違い 5: パフォーマンスよりも理論に過度に注目する
実際のモデルのパフォーマンスよりも理論に過度に依存すると、当面のプロジェクト全体に大きな反発が生じます。 ソリューションの精度は、選択したアルゴリズム、使用するデータ、および設定したパラメーターに大きく依存します。 すべての実用性を考慮すると、間違いなく結果にプラスの影響を与えるでしょう。
間違い 6: ソリューションのカスタマイズでの失敗
プログラム実装を複数のプロジェクトで再利用しないことを強くお勧めします。 データ サイエンスは、万能のストリームではありません。 あるプロジェクト用に設計された 1 つのソリューションが、別のプロジェクトに完全に適用される場合とそうでない場合があります。 ビジネス上の問題は 2 つとして同じではありません。 したがって、カスタムメイドのソリューションを作成する際には、徹底的なこだわりが求められます。
間違い 7: 問題に対する間違ったツールの選択