Парсинг строки датафрема

Есть датафрейм movies со столбцом title, в котором содержатся строки с названием года выпуска фильма (пример: Stanley Kubrick: A Life in Pictures (2001)). Задание: создать переменную years со списком всех годов с 1950 по 2010. Вопрос: как я могу распарсить строки данного столбца, чтобы вычленить оттуда год? Думаю обернуть всё это в функцию, чтобы потом применить к df и создать новый столбец. В примере лекции показан метод from urllib import parse, но он применим к ссылкам URL, не к строкам, насколько я понимаю. Помогите, пожалуйста

Заранее благодарю


Ответы (1 шт):

Автор решения: MaxU

Воспользуйтесь методом Series.str.extract() чтобы вычленить год выпуска из наименования фильма.

PS надеюсь с регулярным выражением справитесь сами)

→ Ссылка