Python is not a great language for data science
Автор утверждает, что Python — неплохой, но не выдающийся язык для data science (исключая deep learning, где PyTorch лидирует). Популярность Python в этой области — историческая случайность, а не признак превосходства. Он удобен для общего программирования, но уступает в data wrangling, exploratory data analysis, визуализации и статистическом моделировании. Совет: используйте знакомый инструмент, но если задачи кажутся чрезмерно сложными, рассмотрите альтернативы вроде R.
В лаборатории по computational biology (20+ лет, ~30 компетентных студентов и постдоков, свободный выбор языка — чаще Python) типичный сценарий: автор просит быстро изменить график (boxplot в violin, line plot в heatmap, histogram в density, расчёт на рангах вместо сырых данных). Студенты отвечают: «Это займёт время, сяду за стол и вернусь». Проблема не в навыках, а в громоздкости инструментов Python, что делает тривиальные операции непростыми.