پایتون ممکن است گزینه دوم برای R باشد، اما محبوبیت و سهولت استفاده آن، آن را در علم داده تسلط میبخشد.
کریستین دوگ، مدیر نوآوری برای تجربیات شخصی در نتفلیکس میگوید: «وقتی [تیم علم داده نتفلیکس] شروع به کار کرد، یک نوع دانشمند داده وجود داشت. اکنون این نقش در سازمان ادغام شده است.» این فقط یک چیز نتفلیکس نیست. در تمام صنایع، شرکتها از علم داده استقبال میکنند تا تجربیات شخصی، جذاب، بهینهسازی قیمتها و موارد دیگر را ایجاد کنند. با انجام این کار، استفاده از علم داده را در مدیریت محصول، بازاریابی و سایر زمینه ها گسترش می دهند.
به همین دلیل است که زبانی که سازمانها برای رمزگشایی دادههای خود استفاده میکنند، به طور فزایندهای پایتون خواهد بود، نه R. از آنجایی که سازمانها به گروههای متنوعتری برای کمک به علم داده نگاه میکنند، جذابیت انبوه Python باعث میشود تا یک راهپیمایی آسان را ایجاد کند. p>
R یا پایتون؟
از لحاظ تاریخی، اگر میخواستید علم داده انجام دهید، باید R. را همانطور که جزئیات در مورد سایت پروژه R، “R مجموعه ای یکپارچه از امکانات نرم افزاری برای دستکاری داده ها، محاسبه و نمایش گرافیکی است.” این واقعاً یک زبان برنامه نویسی نیست، بلکه شامل یکی است. R که در اصل برای تجزیه و تحلیل آماری و عددی ساخته شده بود، به آن ریشه ها وفادار مانده است و ابزاری عالی است، به ویژه برای آماردانان در نقش خود به عنوان دانشمندان داده. با توجه به گسترش علم داده فراتر از حوزه تجزیه و تحلیل آماری، این نقطه قوت می تواند یک ضعف نیز باشد.
این درست است، به عنوان Sheetal Kalburgi، مدیر محصول مرتبط در Anaconda، اشاره میکند، که “دانشمندان داده بیشتر فنی و آماری هستند” و اغلب “مسئول کارهایی مانند توسعه الگوریتمهای آماری پیچیده هستند که عملکرد محصول، پیشبینی نتایج، طراحی آزمایشهایی مانند A/ تست B، و بهینه سازی عملیات محاسباتی، به نام چند. اما آنها همچنین تمایل دارند در برنامه نویسی به خوبی تبحر داشته باشند، جایی که دانشمند داده متوسط شما به احتمال زیاد دارای پیشینه برنامه نویسی نسبت به پیشینه آماری سخت هسته است.
حتی اگر مشکل تجاری یک شرکت بر آمار متمرکز باشد، باز هم غالباً پایتون برتری خواهد داشت، البته فقط به دلیل آشنایی. همانطور که ون لیندبرگ، مشاور عمومی بنیاد نرم افزار پایتون به من گفت، “پایتون دومین بهترین است. زبان برای همه چیز R ممکن است برای آمار بهترین باشد، اما پایتون دومین … و دومین بهترین برای [یادگیری ماشین]، خدمات وب، ابزارهای پوسته و (درج مورد استفاده در اینجا) است. اگر میخواهید کارهایی بیش از آمار انجام دهید، وسعت پایتون یک پیروزی بزرگ است.”
هیچ کس واقعاً مدال نقره را به جای طلا نمیخواهد، اما در این مورد، مقام دوم به این معنی است که پایتون خود را برای طیف وسیعتری از موارد استفاده مفید خواهد کرد. همانطور که پیتر وانگ، مدیر عامل آناکوندا در مصاحبه ای گفت: “پایتون از ابتدا دامنه وسیع تری داشت.” DNA مهندسی و علم “در هسته پایتون پخته شده است.” بنابراین، این پاسخ درست خیلی بیشتر از R.
خواهد بود
پایتون علم داده را می بلعد
این انتقادی از R نیست، بلکه شناخت شتاب و جرم پایتون برای آن است. طبق نظرسنجی اخیر SlashData روی بیش از ۲۰۰۰۰ توسعهدهنده، Python یک برنامهنویس عزیز است و از نظر محبوبیت پس از جاوا اسکریپت در رتبه دوم قرار دارد. بخشی از این امر ناشی از جامعه عظیم اطراف پایتون است که ابزار پایتون را به انواع دامنهها (یادگیری عمیق، هوش مصنوعی و موارد دیگر) گسترش میدهد در حالی که آن را در زمینههای کلیدی تنظیم میکند برای بهبود عملکرد. برای استفاده از عبارت لیندبرگ، یافتن مناطقی که پایتون در آن تلاش نمیکند تا گزینه اول باشد، و نه صرفاً «بهترین گزینه دوم» باشد، به طور فزایندهای دشوار است.
بخشی از محبوبیت پایتون به سادگی از سادگی استفاده از آن ناشی میشود. با توجه به اینکه شرکت ها به شدت در تلاش هستند تا استعدادهای علم داده را بیابند، ساده ترین راه این است که کارمندان موجود را برش بزنیم. حتی کسانی که پیشینه مهندسی ندارند، به راحتی می توانند از نحو ساده و خوانایی Python استقبال کنند و از مفید بودن آن برای نمونه سازی سریع قدردانی کنند.
اخیراً، سهولت استفاده از Python با انتشار Anaconda PyScript آسانتر شده است. ، که با ایجاد امکان نوشتن Python در HTML برای ساخت برنامه های وب، پایتون را برای توسعه دهندگان فرانت اند قابل دسترس تر می کند. این فقط یک نوآوری دیگر در یک رشته طولانی از نوآوریها در جامعه پایتون است تا وسعت و عمق کاری را که توسعهدهندگان و دانشمندان داده میتوانند با پایتون انجام دهند، گسترش دهد.
این نوآوریها و جامعه پایتون که از آنها سود میبرد، تصمیم به استفاده از پایتون را بسیار آسانتر میکنند. برای مناطقی که R یا جایگزین دیگری ممکن است انتخاب اول باشد، وانگ تاریخچه پایتون را به عنوان یک زبان چسب عالی پیشنهاد میکند به این معنی که «شاید کسی یک لفاف پایتون زیبا بسازد تا یک شیم نازک را در معرض دید برخی از قابلیتهای R قرار دهد» یا در غیر این صورت این کار را برای یک کاربر آسان کند. دانشمند داده برای ساخت با پایتون و در عین حال افزودن مکمل هایی از جوامع دیگر، مانند R.
همه اینها به توضیح اینکه چرا پایتون به نظر میرسد قرار است به پیشبرد دهه آینده علم داده کمک کند، با توجه به اینکه چقدر برای دانشمندان داده با تجربه و مشتاقان کمتجربه قوی است، کمک میکند.
پست های مرتبط
همانطور که علم داده به جریان اصلی می رود، زبان آن نیز رو به افزایش است
همانطور که علم داده به جریان اصلی می رود، زبان آن نیز رو به افزایش است
همانطور که علم داده به جریان اصلی می رود، زبان آن نیز رو به افزایش است