🏠А вы знали, что знаменитый датасет Boston housing prices удалили из scikit-learn?Раньше можно было загрузить датасет одной строчкой sklearn.datasets.load_boston(). Начиная с версии scikit-learn 1.2 вызов этой функции приводит к ошибке. Дело в том, что в датасете нашли этическую проблему. Оказалось, что авторы Boston housing prices сгенерировали новый признак B, учитывающий долю темнокожих по городам. Этот признак показывал, что расовая самосегрегация положительно влияет на цены на жильё.Стоит отметить, что эти данные были собраны для исследования «Hedonic prices and the demand for clean air» («Гедонические цены и спрос на чистый воздух») 1978 года. Команда scikit-learn настоятельно не рекомендует использовать этот набор данных, если только целью не является изучение этических проблем в data science и machine learning. Датасет всё ещё можно достать по прямой ссылке: http://lib.stat.cmu.edu/datasets/boston