Журналистика и медиаграмотность — The New York Times
Журналистика и медиаграмотность — The New York TimesРеклама
Продолжить чтение основного материала
The Learning Network
Ресурсы для обучения журналистике и медиаграмотности с использованием материалов New York Times
Ресурсы для обучения журналистике и медиаграмотности с использованием материалов New York Times
Highlights
900 14Конкурсы
Thinking Made Visible: Победители нашего конкурса одностраничных изданий
Мы предложили подросткам отреагировать на статью в Times по своему выбору, создав иллюстрированный справочник о том, что они почерпнули. Вот наши любимые.
От The Learning Network
Текущие события
Подростки и дезинформация: некоторые отправные точки для обучения медиаграмотности
Пять идей, которые помогут учащимся понять проблему, освоить базовые навыки, поделиться своим опытом и высказать свое мнение о том, как преподается медиаграмотность.
Кэтрин Шультен
- Фото: Дмитрий Костюков для The New York Times
Обсуждение текущих событий
Что подростки хотят, чтобы взрослые знали об их жизни в Интернете как «мир бесконечных возможностей ». Но, признались они, не без недостатков.
От The Learning Network
- PhotoCredit
Film Club
8 Фильмы об использовании и злоупотреблении цифровыми медиа
Социальные сети, вирусные видео, теории заговора и «Улица Сезам». Это лишь некоторые из тем, которые учащиеся могут изучить в этом сборнике о преимуществах и опасностях цифровых медиа.
Джереми Энгл
Текущие события 2 Что может произойти в представительной демократии, когда политики и значительная часть электората сомневаетесь в легитимности выборов?
Майкл Гончар
Новостная грамотность
PhotoCreditПлан урока: что делает фоторедактор?
На этом уроке учащиеся будут играть роль фоторедактора, чтобы узнать, как изображения, которые они видят в The New York Times, попадают с камеры на бумагу.
Эрика Акерберг и Натали Пру
- PhotoCredit
Улучшение вашей «новостной диеты»: трехэтапный план урока для подростков и учителей
Дополнение к нашему конкурсу для студентов по медиаграмотности «Исследуйте свои отношения с новостями».
Кэтрин Шультен и Джихи Джолли
Тексты наставников
PhotoCreditHudson ChristieХотите создать свой собственный подкаст? Вот совет о том, как начать.
В этих трех коротких видеороликах два продюсера Times и один победитель студенческого конкурса делятся советами о том, как планировать, писать сценарии и записывать содержательные подкасты.
От The Learning Network
Новостная грамотность
PhotoCreditИстория происхождения: как репортер комиксов раскрывает чудеса
В комиксе о репортажах о комиксах журналист Times рассказывает вам о своем процессе — от идеи до презентации, исследования и написания.
Джордж Джин Густинс
Реклама
Продолжить чтение основной истории
Отличные идеи читателей
Создание журнала для занятий, который может «заставить людей слушать» 9 0009
На этом уроке ELA в восьмом классе учащиеся пишут , редактируйте и оформляйте журнал мнений, которым они могут поделиться со всем миром.
от Эмили Патон
Соревнования
Как создать однолетний: руководство для нашего в конце семестра. .
Кэтрин Шультен
Графические подсказки
Поиски в TikTok
Используете ли вы TikTok в качестве поисковой системы? Как?
The Learning Network
Мнение учащихся
Чего взрослые не понимают в подростковой жизни в Интернете?
Форум для молодых людей, где они могут поделиться своим опытом и мнениями, а также дать взрослым советы о том, как сделать обучение медиаграмотности более актуальным и полезным.
Кэтрин Шультен
План урока
Кубинский ракетный кризис и его актуальность сегодня
Шестьдесят лет назад мир балансировал на грани ядерной войны. Сегодня мы сталкиваемся с новой ядерной угрозой по мере эскалации событий в Украине. Каковы уроки кубинского ракетного кризиса для нас сейчас?
Джереми Энгл. , дневниковые записи, графики, тексты, рецепты и разглагольствования — рассказывает историю незабываемого года.
Кэтрин Шультен
Текущие события
Запрещенные книги, подвергнутые цензуре темы: Преподавание о битве за то, что ученики должны изучать
Рекомендации по использованию последних статей Times и Learning Network, видео, подкастов, студенческих форумов и многого другого.
Кэтрин Шультен
беседа о текущих событиях
Что студенты говорят о растущей борьбе за то, что молодежь может читать через страна. Вот что они сказали.
Сеть обучения
Стратегии преподавания
10 идей для создания сообщества в начале учебного года
Вдохновленные беззаботными статьями New York Times из разных разделов, эти упражнения могут помочь учащимся узнать друг друга.
Кэтрин Шультен
Конкурсы
Познакомьтесь с людьми, отмеченными в профилях наших победителей
Подростки от Индии до Айовы брали интервью и фотографировали интересных людей в своих сообществах. Вот 10 их предметов.
The Learning Network
StoryWeb: Эксперименты по построению графических данных из журналистских текстов
Анализируйте и исследуйте отношения между бенефициарными владельцами, санкциями и политиками с помощью OpenScreening, основанного на данных OpenSanctions KYB.
Вы когда-нибудь слышали о компании Sandalwood Continental? Компания, зарегистрированная на Британских Виргинских островах, участвовала в различных широко известных схемах отмывания денег, но если вы не страстный фанат слежки за олигархами, ответ, скорее всего, будет отрицательным. Сандаловое дерево связано с Сергеем Ролдугиным, другом детства президента России Владимира Путина. Учитывая эти связи, вероятно, было бы неплохо избегать деловых отношений с ним.
Тем не менее, даже с учетом ужесточения санкций в связи с вторжением России в Украину, Сандаловое дерево напрямую не числится ни в одном санкционном списке. Тем не менее, это обсуждалось в новостях и даже упоминалось на странице Ролдугина в Википедии. Это часть странного сектора знаний: вещей, о которых мы знаем как исследовательское сообщество, но которые недоступны в виде структурированных данных.
С инженерной точки зрения возникает интересный вопрос: можем ли мы использовать сообщения СМИ в качестве источника данных для выявления лиц и компаний, находящихся под санкциями? Поиск ответов на этот вопрос был целью StoryWeb, приложения для интеллектуального анализа данных с открытым исходным кодом, прототипом которого мы занимались последние шесть месяцев.
Факты, а не сантименты
Использование журналистских репортажей в качестве источника информации о соответствии, конечно, не новая идея. Однако многие неблагоприятные медиа-системы сосредоточены на том, чтобы связать объекты, упомянутые в статье, с конкретными событиями или формами неправомерного поведения. Например, в статье о горнодобывающей компании могут упоминаться нарушения трудовых прав или перемещение коренных жителей, что приводит к отрицательной оценке риска ESG для фирмы.
StoryWeb, с другой стороны, ориентирован на несколько иной тип анализа. Вместо настроений инструмент предназначен для поиска связности сущностей. Сущности в системе — люди, компании, места — связаны друг с другом с точки зрения фиксированной таксономии типов связи: они могут быть членами семьи или деловыми партнерами; человек может владеть компанией или контролировать ее и т.д.
Идея, стоящая за этим: создать сеть разыскиваемых и находящихся под санкциями лиц, включив в нее организации второго уровня, которые используются для сокрытия и маскировки незаконной деятельности — консильери, офшорные компании, доверенных лиц и старых школьных друзей.
Специфическая для истории сеть сущностей, связанных с историей, о которой сообщили СМИ.
К сожалению, по мере того, как вы переходите от разговора о «больших парнях» к описанию их помощников, проблема двусмысленности имен становится более серьезной: новостная статья о «Дональде Трампе», скорее всего, относится к бывшему президенту США, его бывший партнер «Майкл Коэн» — гораздо менее уникальный дескриптор, особенно если вы затем попытаетесь сопоставить его имя с другими общедоступными записями из США. Есть сотни и сотни людей с таким именем.
Создание графа данных
Внутри StoryWeb сети генерируются путем создания «историй»: каждая представляет собой набор статей, связанных с одной и той же темой или новостным событием. Хорошим примером может служить скандал вокруг немецкого финтеха/мошенничества Wirecard. Хотя существуют тысячи статей о крахе банка, все они относятся к одному и тому же набору лиц: руководителям банка, их деловым партнерам и критикам, которые назвали их блефом.
Чтобы начать построение истории, аналитик добавит в нее новостные статьи: либо добавляя ссылки вручную через пользовательский интерфейс, либо выбирая статьи из архива отчетов, просканированного mediacrawl, компонент StoryWeb, отвечающий за массовый импорт СМИ. По мере добавления статей система извлекает названия компаний и людей, упомянутых в каждом тексте, и начинает вести учет того, какие пары имен чаще всего встречаются в статьях, составляющих часть истории.
Затем эти пары рассматриваются как возможные отношения между сущностями: если Wirecard AG и человек по имени Маркус Браун появляются вместе в 15 из 20 статей, связанных с предметом, возможно, существует связь?
Конечно, теперь ожидаемый способ ответить на этот вопрос — применить некоторую форму машинного обучения, которая интерпретирует статьи и делает наилучшее предположение о характере отношений. (На самом деле, вы могли бы сделать то же самое, чтобы в первую очередь создать актуальные темы: загрузить целый архив статей, а затем заставить алгоритм объединить их в набор статей.)
Хотя это то, что StoryWeb может сделать в будущем, сейчас он использует другой подход: спросите аналитика. Вклад аналитиков уже хорошо послужил нам в OpenSanctions при разработке нашего подхода к дедупликации сущностей, поэтому мы разработали интерфейс, предлагающий пользователю возможные отношения между двумя сущностями, набор параметров классификации и способ быстрого погружения во все статьи, в которых оба объекта упоминаются вместе.
StoryWeb предлагает аналитику определить отношения между двумя объектами, выбрав вариант из фиксированной онтологии.
Этот подход с участием человека предназначен для обеспечения двух вещей: надежного уровня качества данных и подготовки данных для будущих, более автоматизированных подходов.
Шум над сигналом
Построив для нас этот «ткацкий станок данных», чтобы сплести графики историй из историй о коррупции, мы подошли к решающему моменту любого исследования, основанного на данных: столкнуться с необработанным материалом. В нашем случае это база данных имен сущностей, извлеченных с помощью spaCy из ок. В качестве рабочего корпуса мы выбрали 22 000 отчетов о коррупции.
Первое, что бросается в глаза: названия географических мест и медиа-организаций. И то, и другое интуитивно понятно: во многих репортажах упоминаются конкретные места — будь то место соответствующего события или национальность одного из главных героев. Названия других медиа-организаций обычно упоминаются, когда в статьях описывается развитие истории и аспекты, о которых сообщалось ранее. Кроме того, все любят говорить о себе.
Но даже если оставить в стороне эти две категории сущностей, остается еще много работы, чтобы правильно ранжировать пары сущностей, которые определяют основные отношения истории. Даже с некоторой нормализацией для учета общей частоты сущностей многие пары, представленные нашим прототипом StoryWeb, казались несколько случайными и очевидными. Настройка порядка, в котором запрашиваются эти пары, станет важной областью будущей работы инструмента.
Основываясь на нашем использовании инструмента в начальный период разработки, теперь у нас есть обучающий набор из 5000 предложений, извлеченных из статей, в которых упоминаются две сущности и для которых известна классификация. Этот материал можно использовать не только для начала разработки автоматического классификатора типов отношений, но, возможно, он также может помочь нам идентифицировать предложения, которые в первую очередь могут определять отношения.
Что дальше?
Хотя StoryWeb оказался поучительным и забавным экспериментом, в этом году мы не планируем вносить данные на основе StoryWeb в информационный продукт OpenSanctions. Вместо этого мы сосредоточимся на тонкой настройке структурированных источников данных нашего предложения, и мы расширимся до данных СМИ только после того, как этот аспект станет намного более зрелым.
Тем временем нас интересуют две будущие разработки StoryWeb: ее использование за пределами OpenSanctions и возможное применение больших моделей машинного обучения на естественном языке, таких как ChatGPT, для решения проблемы классификации отношений.
Мы считаем, что StoryWeb мог бы, например, быть интересным способом для репортеров и аналитиков узнать биографию человека или ознакомиться с историей, над которой они раньше не работали.
StoryWeb будет побуждать таких пользователей к систематическому пониманию ключевых взаимосвязей, описанных в наборе статей, и вознаграждать их извлечением структурированных данных из полученного графа сущностей — данных, которые они затем могут сопоставлять с объемными наборами данных, такими как просочившиеся архивы электронной почты или базы данных бенефициарных владельцев. Также нет причин, по которым входными данными для экземпляра StoryWeb должны быть новостные статьи. Благодаря микроформату articledata, используемому для массового импорта текста, вы можете легко загрузить все доказательства и документы для судебного дела или, например, исторический архив.
Звучит полезно? StoryWeb — это, конечно же, программное обеспечение с открытым исходным кодом. Технические пользователи могут легко развернуть контейнер Docker на своем локальном компьютере или на сервере и поиграть с инструментом там!
Наконец, наступило начало 2023 года, и мы не можем завершить этот пост в блоге, не упомянув гиганта ИИ в комнате: ChatGPT.