از شاخصهای اصلی برای موفقیت در کارهای مبتنی بر هوش مصنوعی، توانایی در کار کردن با دادههای گوناگون است؛ قرارگرفتن در زیستبوم متخصصین تحلیل دادهها، نیازمند دانستن گامهای مشخصی مانند شناخت نوع دادهها، آمادهسازی دادههایی که بهاصطلاح تمیز نیستند و بالاخره انجام تحلیل مناسب بر روی دادههای تمیزشده مبتنی بر نوع آنها میباشد که این گامها در قالب یک فرایند تکرارپذیر موسوم به دادهکاوی انجام میشوند. خوشبختانه در ابزارهای دادهکاوی امروزه کمبودی نیست اما در مسیر انتخاب یک ابزار قدرتمند، که هم کدباز بوده تا دچار محدودیتهای تجاری نباشد و هم قابلیت پردازش انواع دادههای کسب و کارها را داشته باشد، زبان برنامهنویسی پایتون گزینه مناسبی است که تمام گامهای یادشده را میتوان با آن اجرا نمود و به تولید دانش کاربردی و بینش حاصل از استخراج الگوهای موجود در درون دادهها دست یافت.