В Стэндфордском университете создана компьютерная модель, с большой точностью предсказывающая итоги выборов по статистике личного транспорта в том или ином районе.
Группе ученых во главе с Ли Фей-Феем для довольно точных прогнозов потребовалось проанализировать 50 млн снимков Гугл Стрит Вью из 200 городов Америки и данные переписи населения. Это много, зато практически бесплатно, особенно когда большую часть работы за людей делают нейросети.
Для получения данных о населении применяются различные традиционные методы. Все они требуют большого времени и денежных вложений. В данном случае исследователи воспользовались современными достижениями в сфере автоматической обработки информации о людях. Сами данные находятся в открытом доступе.
Ученые использовали информацию о личном транспорте граждан Америки для прогноза демографических показателей. Они сделали анализ снимков окрестной территории и получили фотографии 22 млн машин, или 32% всего зарегистрированного личного транспорта исследованных городов. Данные были получены в результате применения новейшего алгоритма распознавания. Он группирует объекты по признакам. Затем машины были классифицированы по марке, типу и дате выпуска самыми эффективными на сегодня в распознавании изображений сверточными нейронными сетями. На этой основе создана информационная база с данными о расовой принадлежности, образовании и годовом доходе граждан. А уже имея такую базу, ученым удалось вычислить политическую ориентацию граждан и соответственно предсказывать итоги выборов. Для этого обучающую выборку натаскали на процентах голосовавших за Обаму (демпартия) в 2008 году. Оказалось: если седанов больше, чем пикапов, то Обама победит с вероятностью 88%, если наоборот – проиграет с вероятностью 82%. Авторы исследования считают, что их метод может эффективно заменить традиционный сбор демографической информации.