Нехватка персонала, политическое вмешательство и приостановка работы федерального правительства — все это нарушает рутинную работу беспартийных федеральных статистических агентств, которые надежно собирают факты и публикуют данные о штате. экономики США и рынка труда США. Многие представители частного сектора, государственных и местных органов власти, аналитических центров, ассоциаций и академических кругов активно поддерживают и отстаивают целостность и важность федеральных данных. Одновременно многие люди и организации могут и должны участвовать в совместной работе по сбору данных, что со временем может привести к получению еще более качественных экономических данных.
Конечно, ничто не может заменить ценность, создаваемую федеральными статистическими агентствами, такими как Бюро статистики труда., следовать общедоступным стандартным операционным процедурам, которые защищают конфиденциальную информацию и предоставляют объективные, своевременные и точные данные для общественности, в соответствии с требованиями двухпартийного закона 2018 года и нормотворчества 2019 года. С 1992 года Национальная академия наук регулярно рекомендует федеральному статистическому управлению лучшие практики. И до недавнего времени, когда агентство было расформировано, независимые технические эксперты Консультативного комитета по пользователям данных регулярно встречались с сотрудниками BLS и консультировали их. Все остальные информационные продукты, включая частные, сопоставимы с федеральными данными.
В то же время, с 2010 года бюджет BLS в реальном выражении сократился на 22 процента, несмотря на необходимость поддержания финансирования и улучшения операционной деятельности. В то время как профессиональные ассоциации экономистов и статистиков рекомендуют увеличить федеральный бюджет на 2026 год на 10 процентов для поддержки текущей деятельности BLS, бюджет президента Дональда Трампа вместо этого рекомендует сократить на 8 процентов и продолжить сокращение персонала. (По оценкам, 20% сотрудников BLS уже покинули свои должности с января 2025 года, а треть руководящих должностей в агентстве вакантны.)
Своевременное предоставление надежных данных для принятия обоснованных решений является основой экономического роста и справедливости в регионе. Соединенные Штаты. Как отметили ранее в этом году Джонатан Коэн из Американской академии искусств и наук и политолог Кэтрин Кремер из Университета Висконсин–Мэдисон, правильные данные необходимы для демократии, которая зависит от информированных граждан.Защита традиции BLS “бесстрашной публикации фактов без оглядки на то, какое влияние эти факты могут оказать на позицию любой партии или взгляды любого сторонника” имеет важное значение для получения надежных федеральных данных. Но одновременно можно найти и другой путь продвижения вперед. Пользователи данных могут работать над проектами, которые способствуют демократизации наших данных.
Если пользователи данных не будут действовать, общедоступные данные могут исчезнуть. В этой колонке освещается прошлая и текущая работа многих организаций и исследователей по защите и сохранению данных о рынке труда, а также представлен новый рабочий документ, который иллюстрирует путь к созданию большего объема данных, знаний и ценности, чем позволяет существующий статус-кво.
В 2020 году почетный профессор Школы государственной службы имени Вагнера Нью-Йоркского университета Джулия Лейн написала манифест, в котором демократизировала наши данные, изложив видение преобразования общедоступных данных путем привлечения потребителей данных к сбору данных и созданию статистических данных, которые могут быть доступны общественности. Ее видение использования общедоступных данных сообществом потенциально может сократить расходы, повысить своевременность, создать большую ценность, обеспечить большую адаптируемость к различным видам использования и стимулировать инновации за счет более широкого участия — и все это при сохранении важной конфиденциальности данных.
Видение Лейн основано на о своем новаторском опыте разработки и последующего создания набора данных в Бюро переписи населения США, который связывает данные о домохозяйствах и работодателях, что включало создание партнерств между штатами для увязки государственных и федеральных источников данных. Затем она приступила к созданию Coleridge Initiative, безопасной платформы для обмена данными на уровне штатов и на федеральном уровне. Оба проекта упомянуты в ее заявлении о присуждении в 2025 году единственной премии за вклад в развитие данных и измерений от Общества экономистов труда.Тысячи практиков и исследователей полагаются на данные, которые она помогла собрать и сконструировать. Работа, связанная с созданием таких наборов данных, потребовала от нее убедить многих сотрудников из многих организаций, у которых было мало стимулов работать над улучшением сбора и обработки общедоступных данных, осознать, что все они выиграют от их существования. Ее усилия заложили важную основу и проложили путь для совместной работы с данными, например, в рамках нового проекта по онлайн-агрегации данных о вакансиях совместно с Национальной биржей труда, в котором участвую я и мои коллеги.
В новом рабочем документе Вашингтонского центра справедливого роста “Извлечение функций O*NET из корпуса NLx для создания общедоступных сводных данных о рынке труда” мои соавторы Стивен Мейзенбахер из Мюнхенского технического университета, Светлозар Несторов из Чикагского университета Лойолы и я опишите построение совокупного набора данных, собранных из онлайн-объявлений о вакансиях в Соединенных Штатах, за период с сентября 2015 по июнь 2025 года. Наш проект основан на единогласной рекомендации Консультативного совета по кадровой информации Министерства труда США от 2024 года о том, чтобы министр труда США инвестировал в своевременные, локализованные и действенные данные. Их главной рекомендацией было укрепить Национальную биржу труда, или NLx.
NLx является хранителем данных о размещении онлайн-объявлений о вакансиях в нашей стране и спонсируется и поддерживается Национальной ассоциацией государственных кадровых агентств и Ассоциацией прямых работодателей, в которую входят крупнейшие в стране работодатели из частного сектора. Мы собрали наш набор данных из более чем 155 миллионов вакансий, собранных исследовательским центром NLx Research Hub, некоммерческим партнерством, миссия которого заключается в “предоставлении наиболее точной и полной информации о реальных вакансиях в режиме онлайн без каких-либо дополнительных затрат государственным кадровым агентствам и работодателям”.
Наш набор данных соответствует таксономии O*NET для понимания работы, используемой многими исследователями и практиками. В нашем наборе данных гораздо больше данных, соответствующих стандартным классификациям для понимания рынка труда США, чем в любом другомв настоящее время доступны другие наборы данных.
Важно отметить, что соглашения и положения об использовании данных NLx защищают конфиденциальную и дезагрегированную информацию. Инструменты обработки естественного языка, которые мы разработали для извлечения стандартных функций O*NET из объявлений о вакансиях, размещены в открытом доступе на платформе обмена кодом Github и платформе сообщества искусственного интеллекта Hugging Face, что позволяет другим пользователям тестировать и внедрять это программное обеспечение, которое мы предоставляем в свободном доступе для некоммерческого использования. Агрегированные данные по роду занятий, отрасли и географическому положению могут и будут публиковаться публично после экспертной оценки и публикации.Собственные информационные продукты NLx включают в себя JOE, который вскоре будет запущен в открытом доступе, где пользователи смогут найти прогноз ежемесячных данных BLS о вакансиях и текучести кадров на месяц раньше официального выпуска, основанный на исторически тесной корреляции между количеством открытых вакансий и текучестью рабочей силы. данные бенчмарка JOLTS и NLx. Кроме того, существует платформа NLx On Demand, которая позволяет пользователям получать доступ к совокупным данным о вакансиях и объявлениях в Интернете. Команда, использующая данные NLx, также разработала инструмент для извлечения навыков в рамках проекта «Использование искусственного интеллекта для извлечения навыков и исследований» (LAiSER) в Институте государственной политики Университета Джорджа Вашингтона и работает с партнерами по всей стране над анализом спроса работодателей. Это лишь некоторые из многих проектов в рамках этой динамично развивающейся национальной экосистемы специалистов по развитию трудовых ресурсов на государственном и местном уровнях, а также сотрудников частного сектора и научных кругов.
Небольшие, гибкие команды, занимающиеся сбором данных и подготовкой сводной статистики, могут оказать влияние. Исследовательский центр NLx и последующая работа, проводимая в его рамках, возникли в результате работы небольшой команды Национальной ассоциации государственных кадровых агентств (NASWA). Докторантка Университета Джорджа Вашингтона Эмма Норткотт (Emma Northcott) впервые предложила подать заявку на получение инвестиций Национального научного фонда и Фонда Гейтса, которые теперь позволяют исследователям получать доступ к высококачественным данным NLx через исследовательский центр.
С 2007 года руководители NASWA постоянно и поэтапно руководят проектом. работа по архивированию онлайн-объявлений о вакансиях из национальной системы распространения информации о рынке труда впервые была предусмотрена в Законе Вагнера-Пейзера 1933 года для содействия эффективному сопоставлению данных на рынке труда. Модель NLx все еще находится на стадии становления и за короткий промежуток времени продемонстрировала успех — и она может сохраниться при поддержке практиков и академических исследователей.
Действительно, партнерство NLx с Ассоциацией прямых работодателей было недавно продлено до 2037 года. NLx предлагает частным работодателям, государственным и местным правительственным учреждениям, аналитикам и исследователям, а также другим лицам принять участие в сборе точных данных и дополнительном использовании этих данных.
Каждый, кто стремится создавать полезные общедоступные данные, стоит на плечах гигантов и должен быть благодарен за их вклад в создание сегодня в Соединенных Штатах общедоступных информационных продуктов мирового уровня. Необходимы постоянные инвестиции в федеральные статистические агентства, а также изменения, направленные на снижение затрат, повышение скорости изменений и адаптацию к меняющимся потребностям пользователей за счет изменения методов работы.
Федеральные статистические агентства также признают необходимость изменений. Одна из проблем, связанных со сбором федеральных данных, заключается в том, что количество ответов на опросы сократилось, особенно в связи с пандемией COVID-19. В недавних сообщениях временного директора Бюро переписи населения США Рона Джармина описываются основные усилия по внедрению потоков данных от внешних поставщиков в режиме реального времени и улучшению сбора данных в бизнес-экосистеме. Тем не менее, как написали ученые-информатики Кристин Л. Боргман из Калифорнийского университета в Лос-Анджелесе и Филип Э. Борн из Университета Вирджинии, “для управления данными и обмена ими нужна деревня” в работе, в которой описывается, как общие подходы необходимы для создания устойчивых систем.Спонсоры, включая федеральное правительство, могли бы поддержать совместное производство общедоступных данных при участии сообщества. Начальные инвестиции в проекты, такие как NLx, необходимы для сбора данных и создания инфраструктуры, защищающей конфиденциальность и позволяющей экосистеме заинтересованных пользователей получать доступ к данным и создавать сводную статистику, которая информирует общественность и создает большую ценность для пользователей.Академические учреждения и журналы могли бы публиковать и вознаграждать рискованные усилия по разработке программного обеспечения и демонстрационных проектов с использованием общедоступных данных, привлекающих соответствующее сообщество. Образовательные учреждения должны понимать, на что существует спрос: в своем манифесте Лейн из Нью-Йоркского университета также указывает на необходимость в подготовленной рабочей силе, способной создавать и использовать возможности совместной работы с данными, которые будут необходимы для этой работы. Преподаватели могут привлекать к работе студентов.
Ничто не может заменить ценность федеральной статистики. Необходимо полностью финансируемое, беспартийное, независимое бюро статистики труда и бюро переписи населения. В то же время общедоступные данные, которые считаются само собой разумеющимися, могут исчезнуть. Показателен один важный пример: вся история онлайн-объявлений о вакансиях, начиная с раннего Интернета и заканчивая 2007 годом, была уничтожена, когда прекратилось федеральное финансирование Американского банка вакансий.
Собирать осколки после сноса сложно. Данные по онлайн-объявлениям о приеме на работу до 2015 года остаются фрагментарными. В ближайшей и среднесрочной перспективе заинтересованное сообщество пользователей может частично заполнить пробелы и добиться прогресса. В долгосрочной перспективе эти усилия можно объединить с уникальными возможностями ключевых федеральных статистических агентств нашей страны, расширить их и дополнить.
Считаете ли вы этот контент информативным и интересным?Получайте обновления и будьте в курсе экономического неравенства и роста в США!
Будьте в курсе наших последних исследований
Федеральные данные post подвергаются атаке, но пользователи данных могут работать сообща, чтобы сохранить и демократизировать их, впервые появившись на сайте Equitable Growth.