۲۹ شهریور ۱۴۰۳

Techboy

اخبار و اطلاعات روز تکنولوژی

همانطور که علم داده به جریان اصلی می رود، زبان آن نیز رو به افزایش است

پایتون ممکن است گزینه دوم برای R باشد، اما محبوبیت و سهولت استفاده آن، آن را در علم داده تسلط می‌بخشد.

پایتون ممکن است گزینه دوم برای R باشد، اما محبوبیت و سهولت استفاده آن، آن را در علم داده تسلط می‌بخشد.

کریستین دوگ، مدیر نوآوری برای تجربیات شخصی در نتفلیکس می‌گوید: «وقتی [تیم علم داده نتفلیکس] شروع به کار کرد، یک نوع دانشمند داده وجود داشت. اکنون این نقش در سازمان ادغام شده است.» این فقط یک چیز نتفلیکس نیست. در تمام صنایع، شرکت‌ها از علم داده استقبال می‌کنند تا تجربیات شخصی، جذاب، بهینه‌سازی قیمت‌ها و موارد دیگر را ایجاد کنند. با انجام این کار، استفاده از علم داده را در مدیریت محصول، بازاریابی و سایر زمینه ها گسترش می دهند.

به همین دلیل است که زبانی که سازمان‌ها برای رمزگشایی داده‌های خود استفاده می‌کنند، به طور فزاینده‌ای پایتون خواهد بود، نه R. از آنجایی که سازمان‌ها به گروه‌های متنوع‌تری برای کمک به علم داده نگاه می‌کنند، جذابیت انبوه Python باعث می‌شود تا یک راه‌پیمایی آسان را ایجاد کند.

R یا پایتون؟

از لحاظ تاریخی، اگر می‌خواستید علم داده انجام دهید، باید R. را همانطور که جزئیات در مورد سایت پروژه R، “R مجموعه ای یکپارچه از امکانات نرم افزاری برای دستکاری داده ها، محاسبه و نمایش گرافیکی است.” این واقعاً یک زبان برنامه نویسی نیست، بلکه شامل یکی است. R که در اصل برای تجزیه و تحلیل آماری و عددی ساخته شده بود، به آن ریشه ها وفادار مانده است و ابزاری عالی است، به ویژه برای آماردانان در نقش خود به عنوان دانشمندان داده. با توجه به گسترش علم داده فراتر از حوزه تجزیه و تحلیل آماری، این نقطه قوت می تواند یک ضعف نیز باشد.

سوئیفت به ایمنی مسابقه داده دست می یابد

این درست است، به عنوان Sheetal Kalburgi، مدیر محصول مرتبط در Anaconda، اشاره می‌کند، که “دانشمندان داده بیشتر فنی و آماری هستند” و اغلب “مسئول کارهایی مانند توسعه الگوریتم‌های آماری پیچیده هستند که عملکرد محصول، پیش‌بینی نتایج، طراحی آزمایش‌هایی مانند A/ تست B، و بهینه سازی عملیات محاسباتی، به نام چند. اما آنها همچنین تمایل دارند در برنامه نویسی به خوبی تبحر داشته باشند، جایی که دانشمند داده متوسط ​​شما به احتمال زیاد دارای پیشینه برنامه نویسی نسبت به پیشینه آماری سخت هسته است.

حتی اگر مشکل تجاری یک شرکت بر آمار متمرکز باشد، باز هم غالباً پایتون برتری خواهد داشت، البته فقط به دلیل آشنایی. همانطور که ون لیندبرگ، مشاور عمومی بنیاد نرم افزار پایتون به من گفت، “پایتون دومین بهترین است. زبان برای همه چیز R ممکن است برای آمار بهترین باشد، اما پایتون دومین … و دومین بهترین برای [یادگیری ماشین]، خدمات وب، ابزارهای پوسته و (درج مورد استفاده در اینجا) است. اگر می‌خواهید کارهایی بیش از آمار انجام دهید، وسعت پایتون یک پیروزی بزرگ است.”

هیچ کس واقعاً مدال نقره را به جای طلا نمی‌خواهد، اما در این مورد، مقام دوم به این معنی است که پایتون خود را برای طیف وسیع‌تری از موارد استفاده مفید خواهد کرد. همانطور که پیتر وانگ، مدیر عامل آناکوندا در مصاحبه ای گفت: “پایتون از ابتدا دامنه وسیع تری داشت.” DNA مهندسی و علم “در هسته پایتون پخته شده است.” بنابراین، این پاسخ درست خیلی بیشتر از R.

تدوین پیش از زمان برای JVM پیشنهاد شده است

خواهد بود

پایتون علم داده را می بلعد

این انتقادی از R نیست، بلکه شناخت شتاب و جرم پایتون برای آن است. طبق نظرسنجی اخیر SlashData روی بیش از ۲۰۰۰۰ توسعه‌دهنده، Python یک برنامه‌نویس عزیز است و از نظر محبوبیت پس از جاوا اسکریپت در رتبه دوم قرار دارد. بخشی از این امر ناشی از جامعه عظیم اطراف پایتون است که ابزار پایتون را به انواع دامنه‌ها (یادگیری عمیق، هوش مصنوعی و موارد دیگر) گسترش می‌دهد در حالی که آن را در زمینه‌های کلیدی تنظیم می‌کند برای بهبود عملکرد. برای استفاده از عبارت لیندبرگ، یافتن مناطقی که پایتون در آن تلاش نمی‌کند تا گزینه اول باشد، و نه صرفاً «بهترین گزینه دوم» باشد، به طور فزاینده‌ای دشوار است.

بخشی از محبوبیت پایتون به سادگی از سادگی استفاده از آن ناشی می‌شود. با توجه به اینکه شرکت ها به شدت در تلاش هستند تا استعدادهای علم داده را بیابند، ساده ترین راه این است که کارمندان موجود را برش بزنیم. حتی کسانی که پیشینه مهندسی ندارند، به راحتی می توانند از نحو ساده و خوانایی Python استقبال کنند و از مفید بودن آن برای نمونه سازی سریع قدردانی کنند.

برنامه های اوراکل برای جاوا در سال 2024

اخیراً، سهولت استفاده از Python با انتشار Anaconda PyScript آسان‌تر شده است. ، که با ایجاد امکان نوشتن Python در HTML برای ساخت برنامه های وب، پایتون را برای توسعه دهندگان فرانت اند قابل دسترس تر می کند. این فقط یک نوآوری دیگر در یک رشته طولانی از نوآوری‌ها در جامعه پایتون است تا وسعت و عمق کاری را که توسعه‌دهندگان و دانشمندان داده می‌توانند با پایتون انجام دهند، گسترش دهد.

این نوآوری‌ها و جامعه پایتون که از آنها سود می‌برد، تصمیم به استفاده از پایتون را بسیار آسان‌تر می‌کنند. برای مناطقی که R یا جایگزین دیگری ممکن است انتخاب اول باشد، وانگ تاریخچه پایتون را به عنوان یک زبان چسب عالی پیشنهاد می‌کند به این معنی که «شاید کسی یک لفاف پایتون زیبا بسازد تا یک شیم نازک را در معرض دید برخی از قابلیت‌های R قرار دهد» یا در غیر این صورت این کار را برای یک کاربر آسان کند. دانشمند داده برای ساخت با پایتون و در عین حال افزودن مکمل هایی از جوامع دیگر، مانند R.

همه اینها به توضیح اینکه چرا پایتون به نظر می‌رسد قرار است به پیشبرد دهه آینده علم داده کمک کند، با توجه به اینکه چقدر برای دانشمندان داده با تجربه و مشتاقان کم‌تجربه قوی است، کمک می‌کند.