yt-dlp/yt_dlp/extractor/atvat.py

# coding: utf-8
from __future__ import unicode_literals

from .common import InfoExtractor
from ..utils import (
    determine_ext,
    dict_get,
    int_or_none,
    unescapeHTML,
)


class ATVAtIE(InfoExtractor):
    _VALID_URL = r'https?://(?:www\.)?atv\.at/(?:[^/]+/){2}(?P<id>[dv]\d+)'
    _TESTS = [{
        'url': 'https://www.atv.at/bauer-sucht-frau-die-zweite-chance/folge-1/d3390693/',
        'md5': 'c471605591009dfb6e6c54f7e62e2807',
        'info_dict': {
            'id': '3390684',
            'ext': 'mp4',
            'title': 'Bauer sucht Frau - Die zweite Chance Folge 1',
        }
    }, {
        'url': 'https://www.atv.at/bauer-sucht-frau-staffel-17/fuenfte-eventfolge/d3339537/',
        'only_matching': True,
    }]

    def _process_source_entry(self, source, part_id):
        source_url = source.get('url')
        if not source_url:
            return
        if determine_ext(source_url) == 'm3u8':
            return self._extract_m3u8_formats(
                source_url, part_id, 'mp4', 'm3u8_native',
                m3u8_id='hls', fatal=False)
        else:
            return [{
                'url': source_url,
            }]

    def _process_entry(self, entry):
        part_id = entry.get('id')
        if not part_id:
            return
        formats = []
        for source in entry.get('sources', []):
            formats.extend(self._process_source_entry(source, part_id) or [])

        self._sort_formats(formats)
        return {
            'id': part_id,
            'title': entry.get('title'),
            'duration': int_or_none(entry.get('duration')),
            'formats': formats
        }

    def _real_extract(self, url):
        display_id = self._match_id(url)
        webpage = self._download_webpage(url, display_id)
        video_data = self._parse_json(unescapeHTML(self._search_regex(
            r'var\splaylist\s*=\s*(?P<json>\[.*\]);',
            webpage, 'player data', group='json')),
            display_id)

        first_video = video_data[0]
        video_id = first_video['id']
        video_title = dict_get(first_video, ('tvShowTitle', 'title'))

        return {
            '_type': 'multi_video',
            'id': video_id,
            'title': video_title,
            'entries': (self._process_entry(entry) for entry in video_data),
        }
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`# coding: utf-8`
			`from __future__ import unicode_literals`

			`from .common import InfoExtractor`
			`from ..utils import (`
			`determine_ext,`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`dict_get,`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`int_or_none,`
			`unescapeHTML,`
			`)`


			`class ATVAtIE(InfoExtractor):`
			`_VALID_URL = r'https?://(?:www\.)?atv\.at/(?:[^/]+/){2}(?P<id>[dv]\d+)'`
			`_TESTS = [{`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`'url': 'https://www.atv.at/bauer-sucht-frau-die-zweite-chance/folge-1/d3390693/',`
			`'md5': 'c471605591009dfb6e6c54f7e62e2807',`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`'info_dict': {`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`'id': '3390684',`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`'ext': 'mp4',`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`'title': 'Bauer sucht Frau - Die zweite Chance Folge 1',`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`}`
			`}, {`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`'url': 'https://www.atv.at/bauer-sucht-frau-staffel-17/fuenfte-eventfolge/d3339537/',`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`'only_matching': True,`
			`}]`

[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`def _process_source_entry(self, source, part_id):`
			`source_url = source.get('url')`
			`if not source_url:`
			`return`
			`if determine_ext(source_url) == 'm3u8':`
			`return self._extract_m3u8_formats(`
			`source_url, part_id, 'mp4', 'm3u8_native',`
			`m3u8_id='hls', fatal=False)`
			`else:`
			`return [{`
			`'url': source_url,`
			`}]`

			`def _process_entry(self, entry):`
			`part_id = entry.get('id')`
			`if not part_id:`
			`return`
			`formats = []`
			`for source in entry.get('sources', []):`
			`formats.extend(self._process_source_entry(source, part_id) or [])`

			`self._sort_formats(formats)`
			`return {`
			`'id': part_id,`
			`'title': entry.get('title'),`
			`'duration': int_or_none(entry.get('duration')),`
			`'formats': formats`
			`}`

[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`def _real_extract(self, url):`
			`display_id = self._match_id(url)`
			`webpage = self._download_webpage(url, display_id)`
			`video_data = self._parse_json(unescapeHTML(self._search_regex(`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`r'var\splaylist\s=\s(?P<json>\[.*\]);',`
[atvat] Fix extraction (closes #18041) 2018-11-16 12:18:50 -05:00			`webpage, 'player data', group='json')),`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`display_id)`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`first_video = video_data[0]`
			`video_id = first_video['id']`
			`video_title = dict_get(first_video, ('tvShowTitle', 'title'))`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00
			`return {`
			`'_type': 'multi_video',`
			`'id': video_id,`
			`'title': video_title,`
[ATV.at] Fix extractor for ATV.at (#816) Authored-by: NeroBurner, coletdjnz Fixes https://github.com/ytdl-org/youtube-dl/issues/29079 2021-08-29 17:34:39 -04:00			`'entries': (self._process_entry(entry) for entry in video_data),`
[atvat] Add new extractor(closes #5325) 2017-03-25 13:13:13 -04:00			`}`