youtube-dl/youtube_dl/extractor/dailymotion.py

# coding: utf-8
from __future__ import unicode_literals

import base64
import functools
import hashlib
import itertools
import json
import random
import re
import string

from .common import InfoExtractor
from ..compat import compat_struct_pack
from ..utils import (
    determine_ext,
    error_to_compat_str,
    ExtractorError,
    int_or_none,
    mimetype2ext,
    OnDemandPagedList,
    parse_iso8601,
    sanitized_Request,
    str_to_int,
    try_get,
    unescapeHTML,
    update_url_query,
    url_or_none,
    urlencode_postdata,
)


class DailymotionBaseInfoExtractor(InfoExtractor):
    @staticmethod
    def _build_request(url):
        """Build a request with the family filter disabled"""
        request = sanitized_Request(url)
        request.add_header('Cookie', 'family_filter=off; ff=off')
        return request

    def _download_webpage_handle_no_ff(self, url, *args, **kwargs):
        request = self._build_request(url)
        return self._download_webpage_handle(request, *args, **kwargs)

    def _download_webpage_no_ff(self, url, *args, **kwargs):
        request = self._build_request(url)
        return self._download_webpage(request, *args, **kwargs)


class DailymotionIE(DailymotionBaseInfoExtractor):
    _VALID_URL = r'(?i)https?://(?:(www|touch)\.)?dailymotion\.[a-z]{2,3}/(?:(?:(?:embed|swf|#)/)?video|swf)/(?P<id>[^/?_]+)'
    IE_NAME = 'dailymotion'

    _FORMATS = [
        ('stream_h264_ld_url', 'ld'),
        ('stream_h264_url', 'standard'),
        ('stream_h264_hq_url', 'hq'),
        ('stream_h264_hd_url', 'hd'),
        ('stream_h264_hd1080_url', 'hd180'),
    ]

    _TESTS = [{
        'url': 'http://www.dailymotion.com/video/x5kesuj_office-christmas-party-review-jason-bateman-olivia-munn-t-j-miller_news',
        'md5': '074b95bdee76b9e3654137aee9c79dfe',
        'info_dict': {
            'id': 'x5kesuj',
            'ext': 'mp4',
            'title': 'Office Christmas Party Review –  Jason Bateman, Olivia Munn, T.J. Miller',
            'description': 'Office Christmas Party Review -  Jason Bateman, Olivia Munn, T.J. Miller',
            'thumbnail': r're:^https?:.*\.(?:jpg|png)$',
            'duration': 187,
            'timestamp': 1493651285,
            'upload_date': '20170501',
            'uploader': 'Deadline',
            'uploader_id': 'x1xm8ri',
            'age_limit': 0,
        },
    }, {
        'url': 'https://www.dailymotion.com/video/x2iuewm_steam-machine-models-pricing-listed-on-steam-store-ign-news_videogames',
        'md5': '2137c41a8e78554bb09225b8eb322406',
        'info_dict': {
            'id': 'x2iuewm',
            'ext': 'mp4',
            'title': 'Steam Machine Models, Pricing Listed on Steam Store - IGN News',
            'description': 'Several come bundled with the Steam Controller.',
            'thumbnail': r're:^https?:.*\.(?:jpg|png)$',
            'duration': 74,
            'timestamp': 1425657362,
            'upload_date': '20150306',
            'uploader': 'IGN',
            'uploader_id': 'xijv66',
            'age_limit': 0,
            'view_count': int,
        },
        'skip': 'video gone',
    }, {
        # Vevo video
        'url': 'http://www.dailymotion.com/video/x149uew_katy-perry-roar-official_musi',
        'info_dict': {
            'title': 'Roar (Official)',
            'id': 'USUV71301934',
            'ext': 'mp4',
            'uploader': 'Katy Perry',
            'upload_date': '20130905',
        },
        'params': {
            'skip_download': True,
        },
        'skip': 'VEVO is only available in some countries',
    }, {
        # age-restricted video
        'url': 'http://www.dailymotion.com/video/xyh2zz_leanna-decker-cyber-girl-of-the-year-desires-nude-playboy-plus_redband',
        'md5': '0d667a7b9cebecc3c89ee93099c4159d',
        'info_dict': {
            'id': 'xyh2zz',
            'ext': 'mp4',
            'title': 'Leanna Decker - Cyber Girl Of The Year Desires Nude [Playboy Plus]',
            'uploader': 'HotWaves1012',
            'age_limit': 18,
        },
        'skip': 'video gone',
    }, {
        # geo-restricted, player v5
        'url': 'http://www.dailymotion.com/video/xhza0o',
        'only_matching': True,
    }, {
        # with subtitles
        'url': 'http://www.dailymotion.com/video/x20su5f_the-power-of-nightmares-1-the-rise-of-the-politics-of-fear-bbc-2004_news',
        'only_matching': True,
    }, {
        'url': 'http://www.dailymotion.com/swf/video/x3n92nf',
        'only_matching': True,
    }, {
        'url': 'http://www.dailymotion.com/swf/x3ss1m_funny-magic-trick-barry-and-stuart_fun',
        'only_matching': True,
    }]

    @staticmethod
    def _extract_urls(webpage):
        # Look for embedded Dailymotion player
        matches = re.findall(
            r'<(?:(?:embed|iframe)[^>]+?src=|input[^>]+id=[\'"]dmcloudUrlEmissionSelect[\'"][^>]+value=)(["\'])(?P<url>(?:https?:)?//(?:www\.)?dailymotion\.com/(?:embed|swf)/video/.+?)\1', webpage)
        return list(map(lambda m: unescapeHTML(m[1]), matches))

    def _real_extract(self, url):
        video_id = self._match_id(url)

        webpage = self._download_webpage_no_ff(
            'https://www.dailymotion.com/video/%s' % video_id, video_id)

        age_limit = self._rta_search(webpage)

        description = self._og_search_description(
            webpage, default=None) or self._html_search_meta(
            'description', webpage, 'description')

        view_count_str = self._search_regex(
            (r'<meta[^>]+itemprop="interactionCount"[^>]+content="UserPlays:([\s\d,.]+)"',
             r'video_views_count[^>]+>\s+([\s\d\,.]+)'),
            webpage, 'view count', default=None)
        if view_count_str:
            view_count_str = re.sub(r'\s', '', view_count_str)
        view_count = str_to_int(view_count_str)
        comment_count = int_or_none(self._search_regex(
            r'<meta[^>]+itemprop="interactionCount"[^>]+content="UserComments:(\d+)"',
            webpage, 'comment count', default=None))

        player_v5 = self._search_regex(
            [r'buildPlayer\(({.+?})\);\n',  # See https://github.com/ytdl-org/youtube-dl/issues/7826
             r'playerV5\s*=\s*dmp\.create\([^,]+?,\s*({.+?})\);',
             r'buildPlayer\(({.+?})\);',
             r'var\s+config\s*=\s*({.+?});',
             # New layout regex (see https://github.com/ytdl-org/youtube-dl/issues/13580)
             r'__PLAYER_CONFIG__\s*=\s*({.+?});'],
            webpage, 'player v5', default=None)
        if player_v5:
            player = self._parse_json(player_v5, video_id, fatal=False) or {}
            metadata = try_get(player, lambda x: x['metadata'], dict)
            if not metadata:
                metadata_url = url_or_none(try_get(
                    player, lambda x: x['context']['metadata_template_url1']))
                if metadata_url:
                    metadata_url = metadata_url.replace(':videoId', video_id)
                else:
                    metadata_url = update_url_query(
                        'https://www.dailymotion.com/player/metadata/video/%s'
                        % video_id, {
                            'embedder': url,
                            'integration': 'inline',
                            'GK_PV5_NEON': '1',
                        })
                metadata = self._download_json(
                    metadata_url, video_id, 'Downloading metadata JSON')

            if try_get(metadata, lambda x: x['error']['type']) == 'password_protected':
                password = self._downloader.params.get('videopassword')
                if password:
                    r = int(metadata['id'][1:], 36)
                    us64e = lambda x: base64.urlsafe_b64encode(x).decode().strip('=')
                    t = ''.join(random.choice(string.ascii_letters) for i in range(10))
                    n = us64e(compat_struct_pack('I', r))
                    i = us64e(hashlib.md5(('%s%d%s' % (password, r, t)).encode()).digest())
                    metadata = self._download_json(
                        'http://www.dailymotion.com/player/metadata/video/p' + i + t + n, video_id)

            self._check_error(metadata)

            formats = []
            for quality, media_list in metadata['qualities'].items():
                for media in media_list:
                    media_url = media.get('url')
                    if not media_url:
                        continue
                    type_ = media.get('type')
                    if type_ == 'application/vnd.lumberjack.manifest':
                        continue
                    ext = mimetype2ext(type_) or determine_ext(media_url)
                    if ext == 'm3u8':
                        m3u8_formats = self._extract_m3u8_formats(
                            media_url, video_id, 'mp4', preference=-1,
                            m3u8_id='hls', fatal=False)
                        for f in m3u8_formats:
                            f['url'] = f['url'].split('#')[0]
                            formats.append(f)
                    elif ext == 'f4m':
                        formats.extend(self._extract_f4m_formats(
                            media_url, video_id, preference=-1, f4m_id='hds', fatal=False))
                    else:
                        f = {
                            'url': media_url,
                            'format_id': 'http-%s' % quality,
                            'ext': ext,
                        }
                        m = re.search(r'H264-(?P<width>\d+)x(?P<height>\d+)', media_url)
                        if m:
                            f.update({
                                'width': int(m.group('width')),
                                'height': int(m.group('height')),
                            })
                        formats.append(f)
            self._sort_formats(formats)

            title = metadata['title']
            duration = int_or_none(metadata.get('duration'))
            timestamp = int_or_none(metadata.get('created_time'))
            thumbnail = metadata.get('poster_url')
            uploader = metadata.get('owner', {}).get('screenname')
            uploader_id = metadata.get('owner', {}).get('id')

            subtitles = {}
            subtitles_data = metadata.get('subtitles', {}).get('data', {})
            if subtitles_data and isinstance(subtitles_data, dict):
                for subtitle_lang, subtitle in subtitles_data.items():
                    subtitles[subtitle_lang] = [{
                        'ext': determine_ext(subtitle_url),
                        'url': subtitle_url,
                    } for subtitle_url in subtitle.get('urls', [])]

            return {
                'id': video_id,
                'title': title,
                'description': description,
                'thumbnail': thumbnail,
                'duration': duration,
                'timestamp': timestamp,
                'uploader': uploader,
                'uploader_id': uploader_id,
                'age_limit': age_limit,
                'view_count': view_count,
                'comment_count': comment_count,
                'formats': formats,
                'subtitles': subtitles,
            }

        # vevo embed
        vevo_id = self._search_regex(
            r'<link rel="video_src" href="[^"]*?vevo\.com[^"]*?video=(?P<id>[\w]*)',
            webpage, 'vevo embed', default=None)
        if vevo_id:
            return self.url_result('vevo:%s' % vevo_id, 'Vevo')

        # fallback old player
        embed_page = self._download_webpage_no_ff(
            'https://www.dailymotion.com/embed/video/%s' % video_id,
            video_id, 'Downloading embed page')

        timestamp = parse_iso8601(self._html_search_meta(
            'video:release_date', webpage, 'upload date'))

        info = self._parse_json(
            self._search_regex(
                r'var info = ({.*?}),$', embed_page,
                'video info', flags=re.MULTILINE),
            video_id)

        self._check_error(info)

        formats = []
        for (key, format_id) in self._FORMATS:
            video_url = info.get(key)
            if video_url is not None:
                m_size = re.search(r'H264-(\d+)x(\d+)', video_url)
                if m_size is not None:
                    width, height = map(int_or_none, (m_size.group(1), m_size.group(2)))
                else:
                    width, height = None, None
                formats.append({
                    'url': video_url,
                    'ext': 'mp4',
                    'format_id': format_id,
                    'width': width,
                    'height': height,
                })
        self._sort_formats(formats)

        # subtitles
        video_subtitles = self.extract_subtitles(video_id, webpage)

        title = self._og_search_title(webpage, default=None)
        if title is None:
            title = self._html_search_regex(
                r'(?s)<span\s+id="video_title"[^>]*>(.*?)</span>', webpage,
                'title')

        return {
            'id': video_id,
            'formats': formats,
            'uploader': info['owner.screenname'],
            'timestamp': timestamp,
            'title': title,
            'description': description,
            'subtitles': video_subtitles,
            'thumbnail': info['thumbnail_url'],
            'age_limit': age_limit,
            'view_count': view_count,
            'duration': info['duration']
        }

    def _check_error(self, info):
        error = info.get('error')
        if error:
            title = error.get('title') or error['message']
            # See https://developer.dailymotion.com/api#access-error
            if error.get('code') == 'DM007':
                self.raise_geo_restricted(msg=title)
            raise ExtractorError(
                '%s said: %s' % (self.IE_NAME, title), expected=True)

    def _get_subtitles(self, video_id, webpage):
        try:
            sub_list = self._download_webpage(
                'https://api.dailymotion.com/video/%s/subtitles?fields=id,language,url' % video_id,
                video_id, note=False)
        except ExtractorError as err:
            self._downloader.report_warning('unable to download video subtitles: %s' % error_to_compat_str(err))
            return {}
        info = json.loads(sub_list)
        if (info['total'] > 0):
            sub_lang_list = dict((l['language'], [{'url': l['url'], 'ext': 'srt'}]) for l in info['list'])
            return sub_lang_list
        self._downloader.report_warning('video doesn\'t have subtitles')
        return {}


class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
    IE_NAME = 'dailymotion:playlist'
    _VALID_URL = r'(?:https?://)?(?:www\.)?dailymotion\.[a-z]{2,3}/playlist/(?P<id>x[0-9a-z]+)'
    _TESTS = [{
        'url': 'http://www.dailymotion.com/playlist/xv4bw_nqtv_sport/1#video=xl8v3q',
        'info_dict': {
            'title': 'SPORT',
            'id': 'xv4bw',
        },
        'playlist_mincount': 20,
    }]
    _PAGE_SIZE = 100

    def _fetch_page(self, playlist_id, authorizaion, page):
        page += 1
        videos = self._download_json(
            'https://graphql.api.dailymotion.com',
            playlist_id, 'Downloading page %d' % page,
            data=json.dumps({
                'query': '''{
  collection(xid: "%s") {
    videos(first: %d, page: %d) {
      pageInfo {
        hasNextPage
        nextPage
      }
      edges {
        node {
          xid
          url
        }
      }
    }
  }
}''' % (playlist_id, self._PAGE_SIZE, page)
            }).encode(), headers={
                'Authorization': authorizaion,
                'Origin': 'https://www.dailymotion.com',
            })['data']['collection']['videos']
        for edge in videos['edges']:
            node = edge['node']
            yield self.url_result(
                node['url'], DailymotionIE.ie_key(), node['xid'])

    def _real_extract(self, url):
        playlist_id = self._match_id(url)
        webpage = self._download_webpage(url, playlist_id)
        api = self._parse_json(self._search_regex(
            r'__PLAYER_CONFIG__\s*=\s*({.+?});',
            webpage, 'player config'), playlist_id)['context']['api']
        auth = self._download_json(
            api.get('auth_url', 'https://graphql.api.dailymotion.com/oauth/token'),
            playlist_id, data=urlencode_postdata({
                'client_id': api.get('client_id', 'f1a362d288c1b98099c7'),
                'client_secret': api.get('client_secret', 'eea605b96e01c796ff369935357eca920c5da4c5'),
                'grant_type': 'client_credentials',
            }))
        authorizaion = '%s %s' % (auth.get('token_type', 'Bearer'), auth['access_token'])
        entries = OnDemandPagedList(functools.partial(
            self._fetch_page, playlist_id, authorizaion), self._PAGE_SIZE)
        return self.playlist_result(
            entries, playlist_id,
            self._og_search_title(webpage))


class DailymotionUserIE(DailymotionBaseInfoExtractor):
    IE_NAME = 'dailymotion:user'
    _VALID_URL = r'https?://(?:www\.)?dailymotion\.[a-z]{2,3}/(?!(?:embed|swf|#|video|playlist)/)(?:(?:old/)?user/)?(?P<user>[^/]+)'
    _MORE_PAGES_INDICATOR = r'(?s)<div class="pages[^"]*">.*?<a\s+class="[^"]*?icon-arrow_right[^"]*?"'
    _PAGE_TEMPLATE = 'http://www.dailymotion.com/user/%s/%s'
    _TESTS = [{
        'url': 'https://www.dailymotion.com/user/nqtv',
        'info_dict': {
            'id': 'nqtv',
            'title': 'Rémi Gaillard',
        },
        'playlist_mincount': 100,
    }, {
        'url': 'http://www.dailymotion.com/user/UnderProject',
        'info_dict': {
            'id': 'UnderProject',
            'title': 'UnderProject',
        },
        'playlist_mincount': 1800,
        'expected_warnings': [
            'Stopped at duplicated page',
        ],
        'skip': 'Takes too long time',
    }]

    def _extract_entries(self, id):
        video_ids = set()
        processed_urls = set()
        for pagenum in itertools.count(1):
            page_url = self._PAGE_TEMPLATE % (id, pagenum)
            webpage, urlh = self._download_webpage_handle_no_ff(
                page_url, id, 'Downloading page %s' % pagenum)
            if urlh.geturl() in processed_urls:
                self.report_warning('Stopped at duplicated page %s, which is the same as %s' % (
                    page_url, urlh.geturl()), id)
                break

            processed_urls.add(urlh.geturl())

            for video_id in re.findall(r'data-xid="(.+?)"', webpage):
                if video_id not in video_ids:
                    yield self.url_result(
                        'http://www.dailymotion.com/video/%s' % video_id,
                        DailymotionIE.ie_key(), video_id)
                    video_ids.add(video_id)

            if re.search(self._MORE_PAGES_INDICATOR, webpage) is None:
                break

    def _real_extract(self, url):
        mobj = re.match(self._VALID_URL, url)
        user = mobj.group('user')
        webpage = self._download_webpage(
            'https://www.dailymotion.com/user/%s' % user, user)
        full_user = unescapeHTML(self._html_search_regex(
            r'<a class="nav-image" title="([^"]+)" href="/%s">' % re.escape(user),
            webpage, 'user'))

        return {
            '_type': 'playlist',
            'id': user,
            'title': full_user,
            'entries': self._extract_entries(user),
        }
-												PEP8 applied

											
										
										
											10 years ago
+								# coding: utf-8
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								from __future__ import unicode_literals
-												[dailymotion] add support for password protected videos(closes #9789)

											
										
										
											6 years ago
+								import base64
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								import functools
-												[dailymotion] add support for password protected videos(closes #9789)

											
										
										
											6 years ago
+								import hashlib
-												[dailymotion] Add an extractor for Dailymotion playlists

											
										
										
											11 years ago
+								import itertools
-												[dailymotion] add support for password protected videos(closes #9789)

											
										
										
											6 years ago
+								import json
 								import random
 								import re
 								import string
-												Move DailyMotion into its own file

											
										
										
											11 years ago
 								from .common import InfoExtractor
-												[dailymotion] use compat_struct_pack

											
										
										
											6 years ago
+								from ..compat import compat_struct_pack
-												Fix imports and general cleanup

· Import from compat what comes from compat. Yes, some names are available in utils too, but that's an implementation detail.
· Use _match_id consistently whenever possible
· Fix some outdated tests
· Use consistent valid URL (always match the whole protocol, no ^ at start required)
· Use modern test definitions

											
										
										
											9 years ago
+								from ..utils import (
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								    determine_ext,
-												Rename error_to_str to error_to_compat_str

											
										
										
											8 years ago
+								    error_to_compat_str,
-												Properly convert errors to strings

											
										
										
											8 years ago
+								    ExtractorError,
-												Fix imports and general cleanup

· Import from compat what comes from compat. Yes, some names are available in utils too, but that's an implementation detail.
· Use _match_id consistently whenever possible
· Fix some outdated tests
· Use consistent valid URL (always match the whole protocol, no ^ at start required)
· Use modern test definitions

											
										
										
											9 years ago
+								    int_or_none,
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								    mimetype2ext,
 								    OnDemandPagedList,
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								    parse_iso8601,
-												Switch codebase to use sanitized_Request instead of
compat_urllib_request.Request

[downloader/dash] Use sanitized_Request

[downloader/http] Use sanitized_Request

[atresplayer] Use sanitized_Request

[bambuser] Use sanitized_Request

[bliptv] Use sanitized_Request

[brightcove] Use sanitized_Request

[cbs] Use sanitized_Request

[ceskatelevize] Use sanitized_Request

[collegerama] Use sanitized_Request

[extractor/common] Use sanitized_Request

[crunchyroll] Use sanitized_Request

[dailymotion] Use sanitized_Request

[dcn] Use sanitized_Request

[dramafever] Use sanitized_Request

[dumpert] Use sanitized_Request

[eitb] Use sanitized_Request

[escapist] Use sanitized_Request

[everyonesmixtape] Use sanitized_Request

[extremetube] Use sanitized_Request

[facebook] Use sanitized_Request

[fc2] Use sanitized_Request

[flickr] Use sanitized_Request

[4tube] Use sanitized_Request

[gdcvault] Use sanitized_Request

[extractor/generic] Use sanitized_Request

[hearthisat] Use sanitized_Request

[hotnewhiphop] Use sanitized_Request

[hypem] Use sanitized_Request

[iprima] Use sanitized_Request

[ivi] Use sanitized_Request

[keezmovies] Use sanitized_Request

[letv] Use sanitized_Request

[lynda] Use sanitized_Request

[metacafe] Use sanitized_Request

[minhateca] Use sanitized_Request

[miomio] Use sanitized_Request

[meovideo] Use sanitized_Request

[mofosex] Use sanitized_Request

[moniker] Use sanitized_Request

[mooshare] Use sanitized_Request

[movieclips] Use sanitized_Request

[mtv] Use sanitized_Request

[myvideo] Use sanitized_Request

[neteasemusic] Use sanitized_Request

[nfb] Use sanitized_Request

[niconico] Use sanitized_Request

[noco] Use sanitized_Request

[nosvideo] Use sanitized_Request

[novamov] Use sanitized_Request

[nowness] Use sanitized_Request

[nuvid] Use sanitized_Request

[played] Use sanitized_Request

[pluralsight] Use sanitized_Request

[pornhub] Use sanitized_Request

[pornotube] Use sanitized_Request

[primesharetv] Use sanitized_Request

[promptfile] Use sanitized_Request

[qqmusic] Use sanitized_Request

[rtve] Use sanitized_Request

[safari] Use sanitized_Request

[sandia] Use sanitized_Request

[shared] Use sanitized_Request

[sharesix] Use sanitized_Request

[sina] Use sanitized_Request

[smotri] Use sanitized_Request

[sohu] Use sanitized_Request

[spankwire] Use sanitized_Request

[sportdeutschland] Use sanitized_Request

[streamcloud] Use sanitized_Request

[streamcz] Use sanitized_Request

[tapely] Use sanitized_Request

[tube8] Use sanitized_Request

[tubitv] Use sanitized_Request

[twitch] Use sanitized_Request

[twitter] Use sanitized_Request

[udemy] Use sanitized_Request

[vbox7] Use sanitized_Request

[veoh] Use sanitized_Request

[vessel] Use sanitized_Request

[vevo] Use sanitized_Request

[viddler] Use sanitized_Request

[videomega] Use sanitized_Request

[viewvster] Use sanitized_Request

[viki] Use sanitized_Request

[vk] Use sanitized_Request

[vodlocker] Use sanitized_Request

[voicerepublic] Use sanitized_Request

[wistia] Use sanitized_Request

[xfileshare] Use sanitized_Request

[xtube] Use sanitized_Request

[xvideos] Use sanitized_Request

[yandexmusic] Use sanitized_Request

[youku] Use sanitized_Request

[youporn] Use sanitized_Request

[youtube] Use sanitized_Request

[patreon] Use sanitized_Request

[extractor/common] Remove unused import

[nfb] PEP 8

											
										
										
											9 years ago
+								    sanitized_Request,
-												[dailymotion] Extract view count (#1895)

											
										
										
											11 years ago
+								    str_to_int,
-												[dailymotion] Improve metadata extraction (closes #17706)

											
										
										
											6 years ago
+								    try_get,
-												[dailymotion] Fix user playlist extraction

											
										
										
											10 years ago
+								    unescapeHTML,
-												[dailymotion] Improve metadata extraction (closes #17706)

											
										
										
											6 years ago
+								    update_url_query,
 								    url_or_none,
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								    urlencode_postdata,
-												Move DailyMotion into its own file

											
										
										
											11 years ago
+								)
-												PEP8 applied

											
										
										
											10 years ago
-												[dailymotion] Disable the family filter in the playlists (fixes #1524)

											
										
										
											11 years ago
+								class DailymotionBaseInfoExtractor(InfoExtractor):
 								    @staticmethod
 								    def _build_request(url):
 								        """Build a request with the family filter disabled"""
-												Switch codebase to use sanitized_Request instead of
compat_urllib_request.Request

[downloader/dash] Use sanitized_Request

[downloader/http] Use sanitized_Request

[atresplayer] Use sanitized_Request

[bambuser] Use sanitized_Request

[bliptv] Use sanitized_Request

[brightcove] Use sanitized_Request

[cbs] Use sanitized_Request

[ceskatelevize] Use sanitized_Request

[collegerama] Use sanitized_Request

[extractor/common] Use sanitized_Request

[crunchyroll] Use sanitized_Request

[dailymotion] Use sanitized_Request

[dcn] Use sanitized_Request

[dramafever] Use sanitized_Request

[dumpert] Use sanitized_Request

[eitb] Use sanitized_Request

[escapist] Use sanitized_Request

[everyonesmixtape] Use sanitized_Request

[extremetube] Use sanitized_Request

[facebook] Use sanitized_Request

[fc2] Use sanitized_Request

[flickr] Use sanitized_Request

[4tube] Use sanitized_Request

[gdcvault] Use sanitized_Request

[extractor/generic] Use sanitized_Request

[hearthisat] Use sanitized_Request

[hotnewhiphop] Use sanitized_Request

[hypem] Use sanitized_Request

[iprima] Use sanitized_Request

[ivi] Use sanitized_Request

[keezmovies] Use sanitized_Request

[letv] Use sanitized_Request

[lynda] Use sanitized_Request

[metacafe] Use sanitized_Request

[minhateca] Use sanitized_Request

[miomio] Use sanitized_Request

[meovideo] Use sanitized_Request

[mofosex] Use sanitized_Request

[moniker] Use sanitized_Request

[mooshare] Use sanitized_Request

[movieclips] Use sanitized_Request

[mtv] Use sanitized_Request

[myvideo] Use sanitized_Request

[neteasemusic] Use sanitized_Request

[nfb] Use sanitized_Request

[niconico] Use sanitized_Request

[noco] Use sanitized_Request

[nosvideo] Use sanitized_Request

[novamov] Use sanitized_Request

[nowness] Use sanitized_Request

[nuvid] Use sanitized_Request

[played] Use sanitized_Request

[pluralsight] Use sanitized_Request

[pornhub] Use sanitized_Request

[pornotube] Use sanitized_Request

[primesharetv] Use sanitized_Request

[promptfile] Use sanitized_Request

[qqmusic] Use sanitized_Request

[rtve] Use sanitized_Request

[safari] Use sanitized_Request

[sandia] Use sanitized_Request

[shared] Use sanitized_Request

[sharesix] Use sanitized_Request

[sina] Use sanitized_Request

[smotri] Use sanitized_Request

[sohu] Use sanitized_Request

[spankwire] Use sanitized_Request

[sportdeutschland] Use sanitized_Request

[streamcloud] Use sanitized_Request

[streamcz] Use sanitized_Request

[tapely] Use sanitized_Request

[tube8] Use sanitized_Request

[tubitv] Use sanitized_Request

[twitch] Use sanitized_Request

[twitter] Use sanitized_Request

[udemy] Use sanitized_Request

[vbox7] Use sanitized_Request

[veoh] Use sanitized_Request

[vessel] Use sanitized_Request

[vevo] Use sanitized_Request

[viddler] Use sanitized_Request

[videomega] Use sanitized_Request

[viewvster] Use sanitized_Request

[viki] Use sanitized_Request

[vk] Use sanitized_Request

[vodlocker] Use sanitized_Request

[voicerepublic] Use sanitized_Request

[wistia] Use sanitized_Request

[xfileshare] Use sanitized_Request

[xtube] Use sanitized_Request

[xvideos] Use sanitized_Request

[yandexmusic] Use sanitized_Request

[youku] Use sanitized_Request

[youporn] Use sanitized_Request

[youtube] Use sanitized_Request

[patreon] Use sanitized_Request

[extractor/common] Remove unused import

[nfb] PEP 8

											
										
										
											9 years ago
+								        request = sanitized_Request(url)
-												[dailymotion] Fix ff cookie and use it for embed page (Closes #5330)

											
										
										
											9 years ago
+								        request.add_header('Cookie', 'family_filter=off; ff=off')
-												[dailymotion] Disable the family filter in the playlists (fixes #1524)

											
										
										
											11 years ago
+								        return request
-												[dailymotion] Added support for subtitles + new InfoExtractor for
generic subtitle download.

The idea is that all subtitle downloaders must descend from SubtitlesIE
and implement only three basic methods to achieve the complete subtitle
download functionality. This will allow to reduce the code in YoutubeIE
once it is rewritten.

											
										
										
											11 years ago
-												[dailymotion:playlist] Detect problematic redirection (fixes #6347)

											
										
										
											9 years ago
+								    def _download_webpage_handle_no_ff(self, url, *args, **kwargs):
 								        request = self._build_request(url)
 								        return self._download_webpage_handle(request, *args, **kwargs)
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								    def _download_webpage_no_ff(self, url, *args, **kwargs):
 								        request = self._build_request(url)
 								        return self._download_webpage(request, *args, **kwargs)
-												PEP8 applied

											
										
										
											10 years ago
-												Move DailyMotion into its own file

											
										
										
											11 years ago
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								class DailymotionIE(DailymotionBaseInfoExtractor):
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								    _VALID_URL = r'(?i)https?://(?:(www|touch)\.)?dailymotion\.[a-z]{2,3}/(?:(?:(?:embed|swf|#)/)?video|swf)/(?P<id>[^/?_]+)'
-												[dailymotion] Correct test case

											
										
										
											10 years ago
+								    IE_NAME = 'dailymotion'
-												[dailymotion] Extract all the available formats (closes #1028)

											
										
										
											11 years ago
 								    _FORMATS = [
-												[dailymotion] Correct test case

											
										
										
											10 years ago
+								        ('stream_h264_ld_url', 'ld'),
 								        ('stream_h264_url', 'standard'),
 								        ('stream_h264_hq_url', 'hq'),
 								        ('stream_h264_hd_url', 'hd'),
 								        ('stream_h264_hd1080_url', 'hd180'),
-												[dailymotion] Extract all the available formats (closes #1028)

											
										
										
											11 years ago
+								    ]
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								    _TESTS = [{
 								        'url': 'http://www.dailymotion.com/video/x5kesuj_office-christmas-party-review-jason-bateman-olivia-munn-t-j-miller_news',
 								        'md5': '074b95bdee76b9e3654137aee9c79dfe',
 								        'info_dict': {
 								            'id': 'x5kesuj',
 								            'ext': 'mp4',
 								            'title': 'Office Christmas Party Review –  Jason Bateman, Olivia Munn, T.J. Miller',
 								            'description': 'Office Christmas Party Review -  Jason Bateman, Olivia Munn, T.J. Miller',
 								            'thumbnail': r're:^https?:.*\.(?:jpg|png)$',
 								            'duration': 187,
 								            'timestamp': 1493651285,
 								            'upload_date': '20170501',
 								            'uploader': 'Deadline',
 								            'uploader_id': 'x1xm8ri',
 								            'age_limit': 0,
-												[dailymotion] Add working test


											
										
										
											7 years ago
+								        },
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								    }, {
 								        'url': 'https://www.dailymotion.com/video/x2iuewm_steam-machine-models-pricing-listed-on-steam-store-ign-news_videogames',
 								        'md5': '2137c41a8e78554bb09225b8eb322406',
 								        'info_dict': {
 								            'id': 'x2iuewm',
 								            'ext': 'mp4',
 								            'title': 'Steam Machine Models, Pricing Listed on Steam Store - IGN News',
 								            'description': 'Several come bundled with the Steam Controller.',
 								            'thumbnail': r're:^https?:.*\.(?:jpg|png)$',
 								            'duration': 74,
 								            'timestamp': 1425657362,
 								            'upload_date': '20150306',
 								            'uploader': 'IGN',
 								            'uploader_id': 'xijv66',
 								            'age_limit': 0,
 								            'view_count': int,
-												[dailymotion] Detect vevo videos (fixes #1532)

All videos from the Vevo user, just embed videos from vevo.com

											
										
										
											11 years ago
+								        },
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'skip': 'video gone',
 								    }, {
-												[dailymotion] Detect vevo videos (fixes #1532)

All videos from the Vevo user, just embed videos from vevo.com

											
										
										
											11 years ago
+								        # Vevo video
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'url': 'http://www.dailymotion.com/video/x149uew_katy-perry-roar-official_musi',
 								        'info_dict': {
 								            'title': 'Roar (Official)',
 								            'id': 'USUV71301934',
 								            'ext': 'mp4',
 								            'uploader': 'Katy Perry',
 								            'upload_date': '20130905',
-												[dailymotion] Detect vevo videos (fixes #1532)

All videos from the Vevo user, just embed videos from vevo.com

											
										
										
											11 years ago
+								        },
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'params': {
 								            'skip_download': True,
 								        },
 								        'skip': 'VEVO is only available in some countries',
 								    }, {
-												[dailymotion] Fix support for age-restricted videos (Fixes #1688)

											
										
										
											11 years ago
+								        # age-restricted video
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'url': 'http://www.dailymotion.com/video/xyh2zz_leanna-decker-cyber-girl-of-the-year-desires-nude-playboy-plus_redband',
 								        'md5': '0d667a7b9cebecc3c89ee93099c4159d',
 								        'info_dict': {
 								            'id': 'xyh2zz',
 								            'ext': 'mp4',
 								            'title': 'Leanna Decker - Cyber Girl Of The Year Desires Nude [Playboy Plus]',
 								            'uploader': 'HotWaves1012',
 								            'age_limit': 18,
-												[dailymotion] Report errors from player v5

											
										
										
											9 years ago
+								        },
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'skip': 'video gone',
 								    }, {
-												[dailymotion] Report errors from player v5

											
										
										
											9 years ago
+								        # geo-restricted, player v5
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'url': 'http://www.dailymotion.com/video/xhza0o',
 								        'only_matching': True,
 								    }, {
-												[dailymotion] Add subtitles test URL for reference

											
										
										
											8 years ago
+								        # with subtitles
-												[dailymotion] Extend _VALID_URL (closes #13079)

											
										
										
											7 years ago
+								        'url': 'http://www.dailymotion.com/video/x20su5f_the-power-of-nightmares-1-the-rise-of-the-politics-of-fear-bbc-2004_news',
 								        'only_matching': True,
 								    }, {
 								        'url': 'http://www.dailymotion.com/swf/video/x3n92nf',
 								        'only_matching': True,
 								    }, {
 								        'url': 'http://www.dailymotion.com/swf/x3ss1m_funny-magic-trick-barry-and-stuart_fun',
 								        'only_matching': True,
 								    }]
-												Move DailyMotion into its own file

											
										
										
											11 years ago
-												[francetv] Recognize more Dailymotion embedded videos

Closes #9955

											
										
										
											8 years ago
+								    @staticmethod
 								    def _extract_urls(webpage):
 								        # Look for embedded Dailymotion player
 								        matches = re.findall(
 								            r'<(?:(?:embed|iframe)[^>]+?src=|input[^>]+id=[\'"]dmcloudUrlEmissionSelect[\'"][^>]+value=)(["\'])(?P<url>(?:https?:)?//(?:www\.)?dailymotion\.com/(?:embed|swf)/video/.+?)\1', webpage)
 								        return list(map(lambda m: unescapeHTML(m[1]), matches))
-												Move DailyMotion into its own file

											
										
										
											11 years ago
+								    def _real_extract(self, url):
-												[dailymotion] Alternative title search (Fixes #3882)

											
										
										
											10 years ago
+								        video_id = self._match_id(url)
-												Move DailyMotion into its own file

											
										
										
											11 years ago
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								        webpage = self._download_webpage_no_ff(
 								            'https://www.dailymotion.com/video/%s' % video_id, video_id)
 								        age_limit = self._rta_search(webpage)
-												[dailymotion] Improve description extraction (closes #16984)


											
										
										
											6 years ago
+								        description = self._og_search_description(
 								            webpage, default=None) or self._html_search_meta(
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								            'description', webpage, 'description')
-												Move DailyMotion into its own file

											
										
										
											11 years ago
-												[dailymotion] Fix view count extraction

Fix view count parsing when the decimal marker is a whitespace, e.g. '101 101'

											
										
										
											8 years ago
+								        view_count_str = self._search_regex(
 								            (r'<meta[^>]+itemprop="interactionCount"[^>]+content="UserPlays:([\s\d,.]+)"',
 								             r'video_views_count[^>]+>\s+([\s\d\,.]+)'),
-												[dailymotion] Add support for new layout (close #13580)

											
										
										
											7 years ago
+								            webpage, 'view count', default=None)
-												[dailymotion] Fix view count extraction

Fix view count parsing when the decimal marker is a whitespace, e.g. '101 101'

											
										
										
											8 years ago
+								        if view_count_str:
 								            view_count_str = re.sub(r'\s', '', view_count_str)
 								        view_count = str_to_int(view_count_str)
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								        comment_count = int_or_none(self._search_regex(
 								            r'<meta[^>]+itemprop="interactionCount"[^>]+content="UserComments:(\d+)"',
-												[dailymotion] Make comment count optional (closes #12209)
Not served anymore

											
										
										
											7 years ago
+								            webpage, 'comment count', default=None))
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
 								        player_v5 = self._search_regex(
-												Start moving to ytdl-org

											
										
										
											5 years ago
+								            [r'buildPlayer\(({.+?})\);\n',  # See https://github.com/ytdl-org/youtube-dl/issues/7826
-												[dailymotion] Restrict player v5 regex (Closes #7826)

											
										
										
											8 years ago
+								             r'playerV5\s*=\s*dmp\.create\([^,]+?,\s*({.+?})\);',
-												[dailymotion] Fix extraction and update _TESTS

Closes #10901

Seems all videos use player V5 syntax now

											
										
										
											8 years ago
+								             r'buildPlayer\(({.+?})\);',
-												[dailymotion] Add support for new layout (close #13580)

											
										
										
											7 years ago
+								             r'var\s+config\s*=\s*({.+?});',
-												Start moving to ytdl-org

											
										
										
											5 years ago
+								             # New layout regex (see https://github.com/ytdl-org/youtube-dl/issues/13580)
-												[dailymotion] Add support for new layout (close #13580)

											
										
										
											7 years ago
+								             r'__PLAYER_CONFIG__\s*=\s*({.+?});'],
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								            webpage, 'player v5', default=None)
 								        if player_v5:
-												[dailymotion] Improve metadata extraction (closes #17706)

											
										
										
											6 years ago
+								            player = self._parse_json(player_v5, video_id, fatal=False) or {}
 								            metadata = try_get(player, lambda x: x['metadata'], dict)
 								            if not metadata:
 								                metadata_url = url_or_none(try_get(
 								                    player, lambda x: x['context']['metadata_template_url1']))
 								                if metadata_url:
 								                    metadata_url = metadata_url.replace(':videoId', video_id)
 								                else:
 								                    metadata_url = update_url_query(
 								                        'https://www.dailymotion.com/player/metadata/video/%s'
 								                        % video_id, {
 								                            'embedder': url,
 								                            'integration': 'inline',
 								                            'GK_PV5_NEON': '1',
 								                        })
 								                metadata = self._download_json(
 								                    metadata_url, video_id, 'Downloading metadata JSON')
 								            if try_get(metadata, lambda x: x['error']['type']) == 'password_protected':
-												[dailymotion] add support for password protected videos(closes #9789)

											
										
										
											6 years ago
+								                password = self._downloader.params.get('videopassword')
 								                if password:
 								                    r = int(metadata['id'][1:], 36)
 								                    us64e = lambda x: base64.urlsafe_b64encode(x).decode().strip('=')
 								                    t = ''.join(random.choice(string.ascii_letters) for i in range(10))
-												[dailymotion] use compat_struct_pack

											
										
										
											6 years ago
+								                    n = us64e(compat_struct_pack('I', r))
-												[dailymotion] add support for password protected videos(closes #9789)

											
										
										
											6 years ago
+								                    i = us64e(hashlib.md5(('%s%d%s' % (password, r, t)).encode()).digest())
 								                    metadata = self._download_json(
 								                        'http://www.dailymotion.com/player/metadata/video/p' + i + t + n, video_id)
-												[dailymotion] Report errors from player v5

											
										
										
											9 years ago
+								            self._check_error(metadata)
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								            formats = []
 								            for quality, media_list in metadata['qualities'].items():
 								                for media in media_list:
 								                    media_url = media.get('url')
 								                    if not media_url:
 								                        continue
 								                    type_ = media.get('type')
 								                    if type_ == 'application/vnd.lumberjack.manifest':
 								                        continue
-												use mimetype2ext to determine manifest ext in multiple extractors

											
										
										
											8 years ago
+								                    ext = mimetype2ext(type_) or determine_ext(media_url)
 								                    if ext == 'm3u8':
-												[dailymotion] remove fragment part from m3u8 urls(closes #8915)

											
										
										
											6 years ago
+								                        m3u8_formats = self._extract_m3u8_formats(
-												[dailymotion] Prefer direct links (Closes #8156)

											
										
										
											8 years ago
+								                            media_url, video_id, 'mp4', preference=-1,
-												[dailymotion] remove fragment part from m3u8 urls(closes #8915)

											
										
										
											6 years ago
+								                            m3u8_id='hls', fatal=False)
 								                        for f in m3u8_formats:
 								                            f['url'] = f['url'].split('#')[0]
 								                            formats.append(f)
-												use mimetype2ext to determine manifest ext in multiple extractors

											
										
										
											8 years ago
+								                    elif ext == 'f4m':
-												Simplify formats accumulation for f4m/m3u8/smil formats

Now all _extract_*_formats routines return a list

											
										
										
											8 years ago
+								                        formats.extend(self._extract_f4m_formats(
 								                            media_url, video_id, preference=-1, f4m_id='hds', fatal=False))
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								                    else:
 								                        f = {
 								                            'url': media_url,
-												[dailymotion] Prefer direct links (Closes #8156)

											
										
										
											8 years ago
+								                            'format_id': 'http-%s' % quality,
-												use mimetype2ext to determine manifest ext in multiple extractors

											
										
										
											8 years ago
+								                            'ext': ext,
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								                        }
 								                        m = re.search(r'H264-(?P<width>\d+)x(?P<height>\d+)', media_url)
 								                        if m:
 								                            f.update({
 								                                'width': int(m.group('width')),
 								                                'height': int(m.group('height')),
 								                            })
 								                        formats.append(f)
 								            self._sort_formats(formats)
 								            title = metadata['title']
 								            duration = int_or_none(metadata.get('duration'))
 								            timestamp = int_or_none(metadata.get('created_time'))
 								            thumbnail = metadata.get('poster_url')
 								            uploader = metadata.get('owner', {}).get('screenname')
 								            uploader_id = metadata.get('owner', {}).get('id')
 								            subtitles = {}
-												[dailymotion] Fix subtitles extraction

											
										
										
											8 years ago
+								            subtitles_data = metadata.get('subtitles', {}).get('data', {})
 								            if subtitles_data and isinstance(subtitles_data, dict):
 								                for subtitle_lang, subtitle in subtitles_data.items():
 								                    subtitles[subtitle_lang] = [{
 								                        'ext': determine_ext(subtitle_url),
 								                        'url': subtitle_url,
 								                    } for subtitle_url in subtitle.get('urls', [])]
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
 								            return {
 								                'id': video_id,
 								                'title': title,
 								                'description': description,
 								                'thumbnail': thumbnail,
 								                'duration': duration,
 								                'timestamp': timestamp,
 								                'uploader': uploader,
 								                'uploader_id': uploader_id,
 								                'age_limit': age_limit,
 								                'view_count': view_count,
 								                'comment_count': comment_count,
 								                'formats': formats,
 								                'subtitles': subtitles,
 								            }
-												Move DailyMotion into its own file

											
										
										
											11 years ago
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								        # vevo embed
 								        vevo_id = self._search_regex(
-												Fix some regexes

											
										
										
											7 years ago
+								            r'<link rel="video_src" href="[^"]*?vevo\.com[^"]*?video=(?P<id>[\w]*)',
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								            webpage, 'vevo embed', default=None)
 								        if vevo_id:
 								            return self.url_result('vevo:%s' % vevo_id, 'Vevo')
-												[dailymotion] Detect vevo videos (fixes #1532)

All videos from the Vevo user, just embed videos from vevo.com

											
										
										
											11 years ago
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								        # fallback old player
 								        embed_page = self._download_webpage_no_ff(
 								            'https://www.dailymotion.com/embed/video/%s' % video_id,
 								            video_id, 'Downloading embed page')
 								        timestamp = parse_iso8601(self._html_search_meta(
 								            'video:release_date', webpage, 'upload date'))
 								        info = self._parse_json(
 								            self._search_regex(
 								                r'var info = ({.*?}),$', embed_page,
 								                'video info', flags=re.MULTILINE),
 								            video_id)
-												Move DailyMotion into its own file

											
										
										
											11 years ago
-												[dailymotion] Report errors from player v5

											
										
										
											9 years ago
+								        self._check_error(info)
-												Dailymotion: fix the download of the video in the max quality (closes #986)

											
										
										
											11 years ago
-												[dailymotion] Extract all the available formats (closes #1028)

											
										
										
											11 years ago
+								        formats = []
 								        for (key, format_id) in self._FORMATS:
 								            video_url = info.get(key)
 								            if video_url is not None:
 								                m_size = re.search(r'H264-(\d+)x(\d+)', video_url)
 								                if m_size is not None:
-												[dailymotion] Convert width and height fields from strings to integers

											
										
										
											10 years ago
+								                    width, height = map(int_or_none, (m_size.group(1), m_size.group(2)))
-												[dailymotion] Extract all the available formats (closes #1028)

											
										
										
											11 years ago
+								                else:
 								                    width, height = None, None
 								                formats.append({
 								                    'url': video_url,
 								                    'ext': 'mp4',
 								                    'format_id': format_id,
 								                    'width': width,
 								                    'height': height,
 								                })
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								        self._sort_formats(formats)
-												Dailymotion: fix the download of the video in the max quality (closes #986)

											
										
										
											11 years ago
-												[dailymotion] Added support for subtitles + new InfoExtractor for
generic subtitle download.

The idea is that all subtitle downloaders must descend from SubtitlesIE
and implement only three basic methods to achieve the complete subtitle
download functionality. This will allow to reduce the code in YoutubeIE
once it is rewritten.

											
										
										
											11 years ago
+								        # subtitles
-												[subtitles] refactor to support websites with subtitle information the
webpage.

I added the parameter webpage, so now it's similar to the way automatic
captions are handled. This is an improvement needed for websites like
TED.

											
										
										
											11 years ago
+								        video_subtitles = self.extract_subtitles(video_id, webpage)
-												[dailymotion] Added support for subtitles + new InfoExtractor for
generic subtitle download.

The idea is that all subtitle downloaders must descend from SubtitlesIE
and implement only three basic methods to achieve the complete subtitle
download functionality. This will allow to reduce the code in YoutubeIE
once it is rewritten.

											
										
										
											11 years ago
-												[dailymotion] Alternative title search (Fixes #3882)

											
										
										
											10 years ago
+								        title = self._og_search_title(webpage, default=None)
 								        if title is None:
 								            title = self._html_search_regex(
 								                r'(?s)<span\s+id="video_title"[^>]*>(.*?)</span>', webpage,
 								                'title')
-												[dailymotion] Extract view count (#1895)

											
										
										
											11 years ago
-												[dailymotion] Fix support for age-restricted videos (Fixes #1688)

											
										
										
											11 years ago
+								        return {
-												[dailymotion] Alternative title search (Fixes #3882)

											
										
										
											10 years ago
+								            'id': video_id,
-												[dailymotion] Extract all the available formats (closes #1028)

											
										
										
											11 years ago
+								            'formats': formats,
-												[Dailymotion] fix uploader name (fixes #3153)

											
										
										
											10 years ago
+								            'uploader': info['owner.screenname'],
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								            'timestamp': timestamp,
-												[dailymotion] Alternative title search (Fixes #3882)

											
										
										
											10 years ago
+								            'title': title,
-												[daylimotion] Adapt to player v5 and modernize (Closes #6151, closes #6250)

											
										
										
											9 years ago
+								            'description': description,
-												[dailymotion] Alternative title search (Fixes #3882)

											
										
										
											10 years ago
+								            'subtitles': video_subtitles,
-												[dailymotion] Fix support for age-restricted videos (Fixes #1688)

											
										
										
											11 years ago
+								            'thumbnail': info['thumbnail_url'],
 								            'age_limit': age_limit,
-												[dailymotion] Extract view count (#1895)

											
										
										
											11 years ago
+								            'view_count': view_count,
-												[dailymotion] Extract duration (closes #6221)

											
										
										
											9 years ago
+								            'duration': info['duration']
-												[dailymotion] Fix support for age-restricted videos (Fixes #1688)

											
										
										
											11 years ago
+								        }
-												[dailymotion] Add an extractor for Dailymotion playlists

											
										
										
											11 years ago
-												[dailymotion] Report errors from player v5

											
										
										
											9 years ago
+								    def _check_error(self, info):
-												[dailymotion] Raise GeoRestrictedError

											
										
										
											7 years ago
+								        error = info.get('error')
-												[dailymotion] add support for password protected videos(closes #9789)

											
										
										
											6 years ago
+								        if error:
 								            title = error.get('title') or error['message']
-												[dailymotion] Raise GeoRestrictedError

											
										
										
											7 years ago
+								            # See https://developer.dailymotion.com/api#access-error
 								            if error.get('code') == 'DM007':
 								                self.raise_geo_restricted(msg=title)
-												[dailymotion] Error spelling

											
										
										
											9 years ago
+								            raise ExtractorError(
-												[dailymotion] Raise GeoRestrictedError

											
										
										
											7 years ago
+								                '%s said: %s' % (self.IE_NAME, title), expected=True)
-												[dailymotion] Report errors from player v5

											
										
										
											9 years ago
-												[dailymotion] Convert to new subtitles system

											
										
										
											9 years ago
+								    def _get_subtitles(self, video_id, webpage):
-												[subtitles] made inheritance hierarchy flat as requested

											
										
										
											11 years ago
+								        try:
-												[subtitles] Use self._download_webpage for extracting the subtitles

It raises ExtractorError for the same exceptions we have to catch.

											
										
										
											11 years ago
+								            sub_list = self._download_webpage(
 								                'https://api.dailymotion.com/video/%s/subtitles?fields=id,language,url' % video_id,
 								                video_id, note=False)
 								        except ExtractorError as err:
-												Rename error_to_str to error_to_compat_str

											
										
										
											8 years ago
+								            self._downloader.report_warning('unable to download video subtitles: %s' % error_to_compat_str(err))
-												[subtitles] made inheritance hierarchy flat as requested

											
										
										
											11 years ago
+								            return {}
 								        info = json.loads(sub_list)
 								        if (info['total'] > 0):
-												[dailymotion] Convert to new subtitles system

											
										
										
											9 years ago
+								            sub_lang_list = dict((l['language'], [{'url': l['url'], 'ext': 'srt'}]) for l in info['list'])
-												[subtitles] made inheritance hierarchy flat as requested

											
										
										
											11 years ago
+								            return sub_lang_list
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								        self._downloader.report_warning('video doesn\'t have subtitles')
-												[subtitles] made inheritance hierarchy flat as requested

											
										
										
											11 years ago
+								        return {}
-												[dailymotion] Add an extractor for Dailymotion playlists

											
										
										
											11 years ago
-												[dailymotion] Disable the family filter in the playlists (fixes #1524)

											
										
										
											11 years ago
+								class DailymotionPlaylistIE(DailymotionBaseInfoExtractor):
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								    IE_NAME = 'dailymotion:playlist'
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								    _VALID_URL = r'(?:https?://)?(?:www\.)?dailymotion\.[a-z]{2,3}/playlist/(?P<id>x[0-9a-z]+)'
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								    _TESTS = [{
 								        'url': 'http://www.dailymotion.com/playlist/xv4bw_nqtv_sport/1#video=xl8v3q',
 								        'info_dict': {
 								            'title': 'SPORT',
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								            'id': 'xv4bw',
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								        },
 								        'playlist_mincount': 20,
 								    }]
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								    _PAGE_SIZE = 100
 								    def _fetch_page(self, playlist_id, authorizaion, page):
 								        page += 1
 								        videos = self._download_json(
 								            'https://graphql.api.dailymotion.com',
 								            playlist_id, 'Downloading page %d' % page,
 								            data=json.dumps({
 								                'query': '''{
 								  collection(xid: "%s") {
 								    videos(first: %d, page: %d) {
 								      pageInfo {
 								        hasNextPage
 								        nextPage
 								      }
 								      edges {
 								        node {
 								          xid
 								          url
 								        }
 								      }
 								    }
 								  }
 								}''' % (playlist_id, self._PAGE_SIZE, page)
 								            }).encode(), headers={
 								                'Authorization': authorizaion,
 								                'Origin': 'https://www.dailymotion.com',
 								            })['data']['collection']['videos']
 								        for edge in videos['edges']:
 								            node = edge['node']
 								            yield self.url_result(
 								                node['url'], DailymotionIE.ie_key(), node['xid'])
-												[dailymotion] Add an extractor for users (closes #1476)

											
										
										
											11 years ago
 								    def _real_extract(self, url):
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								        playlist_id = self._match_id(url)
-												[dailymotion] Add an extractor for users (closes #1476)

											
										
										
											11 years ago
+								        webpage = self._download_webpage(url, playlist_id)
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								        api = self._parse_json(self._search_regex(
 								            r'__PLAYER_CONFIG__\s*=\s*({.+?});',
 								            webpage, 'player config'), playlist_id)['context']['api']
 								        auth = self._download_json(
 								            api.get('auth_url', 'https://graphql.api.dailymotion.com/oauth/token'),
 								            playlist_id, data=urlencode_postdata({
 								                'client_id': api.get('client_id', 'f1a362d288c1b98099c7'),
 								                'client_secret': api.get('client_secret', 'eea605b96e01c796ff369935357eca920c5da4c5'),
 								                'grant_type': 'client_credentials',
 								            }))
 								        authorizaion = '%s %s' % (auth.get('token_type', 'Bearer'), auth['access_token'])
 								        entries = OnDemandPagedList(functools.partial(
 								            self._fetch_page, playlist_id, authorizaion), self._PAGE_SIZE)
 								        return self.playlist_result(
 								            entries, playlist_id,
 								            self._og_search_title(webpage))
 								class DailymotionUserIE(DailymotionBaseInfoExtractor):
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								    IE_NAME = 'dailymotion:user'
-												[dailymotion] Extend _VALID_URL

											
										
										
											8 years ago
+								    _VALID_URL = r'https?://(?:www\.)?dailymotion\.[a-z]{2,3}/(?!(?:embed|swf|#|video|playlist)/)(?:(?:old/)?user/)?(?P<user>[^/]+)'
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								    _MORE_PAGES_INDICATOR = r'(?s)<div class="pages[^"]*">.*?<a\s+class="[^"]*?icon-arrow_right[^"]*?"'
-												[dailymotion] Add an extractor for users (closes #1476)

											
										
										
											11 years ago
+								    _PAGE_TEMPLATE = 'http://www.dailymotion.com/user/%s/%s'
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								    _TESTS = [{
 								        'url': 'https://www.dailymotion.com/user/nqtv',
 								        'info_dict': {
 								            'id': 'nqtv',
 								            'title': 'Rémi Gaillard',
 								        },
 								        'playlist_mincount': 100,
-												[dailymotion:playlist] Detect problematic redirection (fixes #6347)

											
										
										
											9 years ago
+								    }, {
 								        'url': 'http://www.dailymotion.com/user/UnderProject',
 								        'info_dict': {
 								            'id': 'UnderProject',
 								            'title': 'UnderProject',
 								        },
 								        'playlist_mincount': 1800,
 								        'expected_warnings': [
 								            'Stopped at duplicated page',
 								        ],
 								        'skip': 'Takes too long time',
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								    }]
-												[dailymotion] Add an extractor for users (closes #1476)

											
										
										
											11 years ago
-												[dailymotion:playlist] fix extraction(closes #16894)

											
										
										
											6 years ago
+								    def _extract_entries(self, id):
 								        video_ids = set()
 								        processed_urls = set()
 								        for pagenum in itertools.count(1):
 								            page_url = self._PAGE_TEMPLATE % (id, pagenum)
 								            webpage, urlh = self._download_webpage_handle_no_ff(
 								                page_url, id, 'Downloading page %s' % pagenum)
 								            if urlh.geturl() in processed_urls:
 								                self.report_warning('Stopped at duplicated page %s, which is the same as %s' % (
 								                    page_url, urlh.geturl()), id)
 								                break
 								            processed_urls.add(urlh.geturl())
 								            for video_id in re.findall(r'data-xid="(.+?)"', webpage):
 								                if video_id not in video_ids:
 								                    yield self.url_result(
 								                        'http://www.dailymotion.com/video/%s' % video_id,
 								                        DailymotionIE.ie_key(), video_id)
 								                    video_ids.add(video_id)
 								            if re.search(self._MORE_PAGES_INDICATOR, webpage) is None:
 								                break
-												[dailymotion] Add an extractor for users (closes #1476)

											
										
										
											11 years ago
+								    def _real_extract(self, url):
 								        mobj = re.match(self._VALID_URL, url)
 								        user = mobj.group('user')
-												[dailymotion:user] Process user home as user (Closes #5823)

											
										
										
											9 years ago
+								        webpage = self._download_webpage(
 								            'https://www.dailymotion.com/user/%s' % user, user)
-												[dailymotion] Fix user playlist extraction

											
										
										
											10 years ago
+								        full_user = unescapeHTML(self._html_search_regex(
 								            r'<a class="nav-image" title="([^"]+)" href="/%s">' % re.escape(user),
-												Move playlist tests to extractors.

From now on, test_download will run these tests. That means we benefit not only from the networking setup in there, but also from the other tests (for example test_all_urls to find problems with _VALID_URLs).

											
										
										
											10 years ago
+								            webpage, 'user'))
-												[dailymotion] Add an extractor for users (closes #1476)

											
										
										
											11 years ago
 								        return {
 								            '_type': 'playlist',
 								            'id': user,
 								            'title': full_user,
 								            'entries': self._extract_entries(user),
 								        }