mirror of
https://github.com/yt-dlp/yt-dlp.git
synced 2024-11-21 20:46:36 -05:00
[dtube] Add new extractor(closes #15201)
This commit is contained in:
parent
1e4fe5a7cc
commit
7f34984e81
2 changed files with 84 additions and 0 deletions
83
youtube_dl/extractor/dtube.py
Normal file
83
youtube_dl/extractor/dtube.py
Normal file
|
@ -0,0 +1,83 @@
|
||||||
|
# coding: utf-8
|
||||||
|
from __future__ import unicode_literals
|
||||||
|
|
||||||
|
import json
|
||||||
|
import re
|
||||||
|
from socket import timeout
|
||||||
|
|
||||||
|
from .common import InfoExtractor
|
||||||
|
from ..utils import (
|
||||||
|
int_or_none,
|
||||||
|
parse_iso8601,
|
||||||
|
)
|
||||||
|
|
||||||
|
|
||||||
|
class DTubeIE(InfoExtractor):
|
||||||
|
_VALID_URL = r'https?://(?:www\.)?d\.tube/(?:#!/)?v/(?P<uploader_id>[0-9a-z.-]+)/(?P<id>[0-9a-z]{8})'
|
||||||
|
_TEST = {
|
||||||
|
'url': 'https://d.tube/#!/v/benswann/zqd630em',
|
||||||
|
'md5': 'a03eaa186618ffa7a3145945543a251e',
|
||||||
|
'info_dict': {
|
||||||
|
'id': 'zqd630em',
|
||||||
|
'ext': 'mp4',
|
||||||
|
'title': 'Reality Check: FDA\'s Disinformation Campaign on Kratom',
|
||||||
|
'description': 'md5:700d164e066b87f9eac057949e4227c2',
|
||||||
|
'uploader_id': 'benswann',
|
||||||
|
'upload_date': '20180222',
|
||||||
|
'timestamp': 1519328958,
|
||||||
|
},
|
||||||
|
'params': {
|
||||||
|
'format': '480p',
|
||||||
|
},
|
||||||
|
}
|
||||||
|
|
||||||
|
def _real_extract(self, url):
|
||||||
|
uploader_id, video_id = re.match(self._VALID_URL, url).groups()
|
||||||
|
result = self._download_json('https://api.steemit.com/', video_id, data=json.dumps({
|
||||||
|
'jsonrpc': '2.0',
|
||||||
|
'method': 'get_content',
|
||||||
|
'params': [uploader_id, video_id],
|
||||||
|
}).encode())['result']
|
||||||
|
|
||||||
|
metadata = json.loads(result['json_metadata'])
|
||||||
|
video = metadata['video']
|
||||||
|
content = video['content']
|
||||||
|
info = video.get('info', {})
|
||||||
|
title = info.get('title') or result['title']
|
||||||
|
|
||||||
|
def canonical_url(h):
|
||||||
|
if not h:
|
||||||
|
return None
|
||||||
|
return 'https://ipfs.io/ipfs/' + h
|
||||||
|
|
||||||
|
formats = []
|
||||||
|
for q in ('240', '480', '720', '1080', ''):
|
||||||
|
video_url = canonical_url(content.get('video%shash' % q))
|
||||||
|
if not video_url:
|
||||||
|
continue
|
||||||
|
format_id = (q + 'p') if q else 'Source'
|
||||||
|
try:
|
||||||
|
self.to_screen('%s: Checking %s video format URL' % (video_id, format_id))
|
||||||
|
self._downloader._opener.open(video_url, timeout=5).close()
|
||||||
|
except timeout as e:
|
||||||
|
self.to_screen(
|
||||||
|
'%s: %s URL is invalid, skipping' % (video_id, format_id))
|
||||||
|
continue
|
||||||
|
formats.append({
|
||||||
|
'format_id': format_id,
|
||||||
|
'url': video_url,
|
||||||
|
'height': int_or_none(q),
|
||||||
|
'ext': 'mp4',
|
||||||
|
})
|
||||||
|
|
||||||
|
return {
|
||||||
|
'id': video_id,
|
||||||
|
'title': title,
|
||||||
|
'description': content.get('description'),
|
||||||
|
'thumbnail': canonical_url(info.get('snaphash')),
|
||||||
|
'tags': content.get('tags') or metadata.get('tags'),
|
||||||
|
'duration': info.get('duration'),
|
||||||
|
'formats': formats,
|
||||||
|
'timestamp': parse_iso8601(result.get('created')),
|
||||||
|
'uploader_id': uploader_id,
|
||||||
|
}
|
|
@ -283,6 +283,7 @@
|
||||||
DRTVIE,
|
DRTVIE,
|
||||||
DRTVLiveIE,
|
DRTVLiveIE,
|
||||||
)
|
)
|
||||||
|
from .dtube import DTubeIE
|
||||||
from .dvtv import DVTVIE
|
from .dvtv import DVTVIE
|
||||||
from .dumpert import DumpertIE
|
from .dumpert import DumpertIE
|
||||||
from .defense import DefenseGouvFrIE
|
from .defense import DefenseGouvFrIE
|
||||||
|
|
Loading…
Reference in a new issue