[abcnews,chilloutsoze,cracked,vice,vk] Use dedicated YouTube embeds extraction routines

2024-11-21 20:46:36 -05:00 · 2017-09-06 00:50:25 +07:00 · 2017-09-06 00:50:25 +07:00 · 5113b69124
commit 5113b69124
parent 66c9fa36c1
5 changed files with 16 additions and 21 deletions
--- a/youtube_dl/extractor/abcnews.py
+++ b/youtube_dl/extractor/abcnews.py
@ -7,6 +7,7 @@
 from .amp import AMPIE
 from .common import InfoExtractor
 from .youtube import YoutubeIE
 from ..compat import compat_urlparse
@ -108,9 +109,7 @@ def _real_extract(self, url):
            r'window\.abcnvideo\.url\s*=\s*"([^"]+)"', webpage, 'video URL')
        full_video_url = compat_urlparse.urljoin(url, video_url)
-        youtube_url = self._html_search_regex(
+        youtube_url = YoutubeIE._extract_url(webpage)
            r'<iframe[^>]+src="(https://www\.youtube\.com/embed/[^"]+)"',
            webpage, 'YouTube URL', default=None)
        timestamp = None
        date_str = self._html_search_regex(
@ -140,7 +139,7 @@ def _real_extract(self, url):
        }
        if youtube_url:
-            entries = [entry, self.url_result(youtube_url, 'Youtube')]
+            entries = [entry, self.url_result(youtube_url, ie=YoutubeIE.ie_key())]
            return self.playlist_result(entries)
        return entry
--- a/youtube_dl/extractor/chilloutzone.py
+++ b/youtube_dl/extractor/chilloutzone.py
@ -5,6 +5,7 @@
 import json
 from .common import InfoExtractor
 from .youtube import YoutubeIE
 from ..utils import (
    clean_html,
    ExtractorError
@ -70,11 +71,9 @@ def _real_extract(self, url):
        # If nativePlatform is None a fallback mechanism is used (i.e. youtube embed)
        if native_platform is None:
-            youtube_url = self._html_search_regex(
+            youtube_url = YoutubeIE._extract_url(webpage)
-                r'<iframe.* src="((?:https?:)?//(?:[^.]+\.)?youtube\.com/.+?)"',
+            if youtube_url:
-                webpage, 'fallback video URL', default=None)
+                return self.url_result(youtube_url, ie=YoutubeIE.ie_key())
            if youtube_url is not None:
                return self.url_result(youtube_url, ie='Youtube')
        # Non Fallback: Decide to use native source (e.g. youtube or vimeo) or
        # the own CDN
--- a/youtube_dl/extractor/cracked.py
+++ b/youtube_dl/extractor/cracked.py
@ -3,6 +3,7 @@
 import re
 from .common import InfoExtractor
 from .youtube import YoutubeIE
 from ..utils import (
    parse_iso8601,
    str_to_int,
@ -41,11 +42,9 @@ def _real_extract(self, url):
        webpage = self._download_webpage(url, video_id)
-        youtube_url = self._search_regex(
+        youtube_url = YoutubeIE._extract_url(webpage)
            r'<iframe[^>]+src="((?:https?:)?//www\.youtube\.com/embed/[^"]+)"',
            webpage, 'youtube url', default=None)
        if youtube_url:
-            return self.url_result(youtube_url, 'Youtube')
+            return self.url_result(youtube_url, ie=YoutubeIE.ie_key())
        video_url = self._html_search_regex(
            [r'var\s+CK_vidSrc\s*=\s*"([^"]+)"', r'<video\s+src="([^"]+)"'],
--- a/youtube_dl/extractor/vice.py
+++ b/youtube_dl/extractor/vice.py
@ -7,6 +7,7 @@
 import json
 from .adobepass import AdobePassIE
 from .youtube import YoutubeIE
 from .common import InfoExtractor
 from ..compat import compat_HTTPError
 from ..utils import (
@ -261,11 +262,9 @@ def _url_res(video_url, ie_key):
        if embed_code:
            return _url_res('ooyala:%s' % embed_code, 'Ooyala')
-        youtube_url = self._html_search_regex(
+        youtube_url = YoutubeIE._extract_url(body)
            r'<iframe[^>]+src="(.*youtube\.com/.*)"',
            body, 'YouTube URL', default=None)
        if youtube_url:
-            return _url_res(youtube_url, 'Youtube')
+            return _url_res(youtube_url, YoutubeIE.ie_key())
        video_url = self._html_search_regex(
            r'data-video-url="([^"]+)"',
--- a/youtube_dl/extractor/vk.py
+++ b/youtube_dl/extractor/vk.py
@ -25,6 +25,7 @@
 from .dailymotion import DailymotionIE
 from .pladform import PladformIE
 from .vimeo import VimeoIE
 from .youtube import YoutubeIE
 class VKBaseIE(InfoExtractor):
@ -345,11 +346,9 @@ def _real_extract(self, url):
            if re.search(error_re, info_page):
                raise ExtractorError(error_msg % video_id, expected=True)
-        youtube_url = self._search_regex(
+        youtube_url = YoutubeIE._extract_url(info_page)
            r'<iframe[^>]+src="((?:https?:)?//www.youtube.com/embed/[^"]+)"',
            info_page, 'youtube iframe', default=None)
        if youtube_url:
-            return self.url_result(youtube_url, 'Youtube')
+            return self.url_result(youtube_url, ie=YoutubeIE.ie_key())
        vimeo_url = VimeoIE._extract_url(url, info_page)
        if vimeo_url is not None: