[mtv] Convert to new subtitles system

2024-11-21 20:46:36 -05:00 · 2015-02-18 18:27:45 +01:00 · 2015-02-18 18:27:45 +01:00 · 0af25f784b
commit 0af25f784b
parent b9b42f2ea0
2 changed files with 23 additions and 19 deletions
--- a/test/test_subtitles.py
+++ b/test/test_subtitles.py
@ -20,6 +20,7 @@
    CeskaTelevizeIE,
    LyndaIE,
    NPOIE,
    ComedyCentralIE,
 )
@ -330,5 +331,20 @@ def test_allsubtitles(self):
        self.assertEqual(md5(subtitles['nl']), 'fc6435027572b63fb4ab143abd5ad3f4')
 class TestMTVSubtitles(BaseTestSubtitles):
    url = 'http://www.cc.com/video-clips/kllhuv/stand-up-greg-fitzsimmons--uncensored---too-good-of-a-mother'
    IE = ComedyCentralIE
    def getInfoDict(self):
        return super(TestMTVSubtitles, self).getInfoDict()['entries'][0]
    def test_allsubtitles(self):
        self.DL.params['writesubtitles'] = True
        self.DL.params['allsubtitles'] = True
        subtitles = self.getSubtitles()
        self.assertEqual(set(subtitles.keys()), set(['en']))
        self.assertEqual(md5(subtitles['en']), 'b9f6ca22a6acf597ec76f61749765e65')
 if __name__ == '__main__':
    unittest.main()
--- a/youtube_dl/extractor/mtv.py
+++ b/youtube_dl/extractor/mtv.py
@ -2,7 +2,7 @@
 import re
-from .subtitles import SubtitlesInfoExtractor
+from .common import InfoExtractor
 from ..compat import (
    compat_urllib_parse,
    compat_urllib_request,
@ -23,7 +23,7 @@ def _media_xml_tag(tag):
    return '{http://search.yahoo.com/mrss/}%s' % tag
-class MTVServicesInfoExtractor(SubtitlesInfoExtractor):
+class MTVServicesInfoExtractor(InfoExtractor):
    _MOBILE_TEMPLATE = None
    @staticmethod
@ -95,25 +95,15 @@ def _extract_video_formats(self, mdoc, mtvn_id):
    def _extract_subtitles(self, mdoc, mtvn_id):
        subtitles = {}
        FORMATS = {
            'scc': 'cea-608',
            'eia-608': 'cea-608',
            'xml': 'ttml',
        }
        subtitles_format = FORMATS.get(
            self._downloader.params.get('subtitlesformat'), 'ttml')
        for transcript in mdoc.findall('.//transcript'):
            if transcript.get('kind') != 'captions':
                continue
            lang = transcript.get('srclang')
-            for typographic in transcript.findall('./typographic'):
+            subtitles[lang] = [{
-                captions_format = typographic.get('format')
+                'url': compat_str(typographic.get('src')),
-                if captions_format == subtitles_format:
+                'ext': typographic.get('format')
-                    subtitles[lang] = compat_str(typographic.get('src'))
+            } for typographic in transcript.findall('./typographic')]
-                    break
+        return subtitles
        if self._downloader.params.get('listsubtitles', False):
            self._list_available_subtitles(mtvn_id, subtitles)
        return self.extract_subtitles(mtvn_id, subtitles)
    def _get_video_info(self, itemdoc):
        uri = itemdoc.find('guid').text
@ -196,8 +186,6 @@ def _real_extract(self, url):
                webpage, 'mgid')
        videos_info = self._get_videos_info(mgid)
        if self._downloader.params.get('listsubtitles', False):
            return
        return videos_info