Update On Sun Nov 16 19:35:42 CET 2025

2025-12-24 13:28:37 +08:00 · 2025-11-16 19:35:43 +01:00
parent 2d1a3e7bc1
commit 3584da6277
144 changed files with 5042 additions and 1648 deletions
--- a/yt-dlp/yt_dlp/downloader/common.py
+++ b/yt-dlp/yt_dlp/downloader/common.py
@@ -461,7 +461,8 @@ class FileDownloader:
            min_sleep_interval = self.params.get('sleep_interval') or 0
            max_sleep_interval = self.params.get('max_sleep_interval') or 0

-            if available_at := info_dict.get('available_at'):
+            requested_formats = info_dict.get('requested_formats') or [info_dict]
+            if available_at := max(f.get('available_at') or 0 for f in requested_formats):
                forced_sleep_interval = available_at - int(time.time())
                if forced_sleep_interval > min_sleep_interval:
                    sleep_note = 'as required by the site'
--- a/yt-dlp/yt_dlp/extractor/_extractors.py
+++ b/yt-dlp/yt_dlp/extractor/_extractors.py
@@ -2523,6 +2523,7 @@ from .yappy import (
    YappyIE,
    YappyProfileIE,
 )
+from .yfanefa import YfanefaIE
 from .yle_areena import YleAreenaIE
 from .youjizz import YouJizzIE
 from .youku import (
--- a/yt-dlp/yt_dlp/extractor/soundcloud.py
+++ b/yt-dlp/yt_dlp/extractor/soundcloud.py
@@ -1064,7 +1064,7 @@ class SoundcloudRelatedIE(SoundcloudPagedPlaylistBaseIE):


 class SoundcloudPlaylistIE(SoundcloudPlaylistBaseIE):
-    _VALID_URL = r'https?://api(?:-v2)?\.soundcloud\.com/playlists/(?P<id>[0-9]+)(?:/?\?secret_token=(?P<token>[^&]+?))?$'
+    _VALID_URL = r'https?://api(?:-v2)?\.soundcloud\.com/playlists/(?:soundcloud(?:%3A|:)playlists(?:%3A|:))?(?P<id>[0-9]+)(?:/?\?secret_token=(?P<token>[^&]+?))?$'
    IE_NAME = 'soundcloud:playlist'
    _TESTS = [{
        'url': 'https://api.soundcloud.com/playlists/4110309',
@@ -1079,6 +1079,12 @@ class SoundcloudPlaylistIE(SoundcloudPlaylistBaseIE):
            'album': 'TILT Brass - Bowery Poetry Club, August \'03 [Non-Site SCR 02]',
        },
        'playlist_count': 6,
+    }, {
+        'url': 'https://api.soundcloud.com/playlists/soundcloud%3Aplaylists%3A1759227795',
+        'only_matching': True,
+    }, {
+        'url': 'https://api.soundcloud.com/playlists/soundcloud:playlists:2104769627?secret_token=s-wmpCLuExeYX',
+        'only_matching': True,
    }]

    def _real_extract(self, url):
--- a/yt-dlp/yt_dlp/extractor/yfanefa.py
+++ b/yt-dlp/yt_dlp/extractor/yfanefa.py
@@ -0,0 +1,67 @@
+from .common import InfoExtractor
+from ..utils import (
+    determine_ext,
+    int_or_none,
+    join_nonempty,
+    remove_end,
+    url_or_none,
+)
+from ..utils.traversal import traverse_obj
+
+
+class YfanefaIE(InfoExtractor):
+    IE_NAME = 'yfanefa'
+    _VALID_URL = r'https?://(?:www\.)?yfanefa\.com/(?P<id>[^?#]+)'
+    _TESTS = [{
+        'url': 'https://www.yfanefa.com/record/2717',
+        'info_dict': {
+            'id': 'record-2717',
+            'ext': 'mp4',
+            'title': 'THE HALLAMSHIRE RIFLES LEAVING SHEFFIELD, 1914',
+            'duration': 5239,
+            'thumbnail': r're:https://media\.yfanefa\.com/storage/v1/file/',
+        },
+    }, {
+        'url': 'https://www.yfanefa.com/news/53',
+        'info_dict': {
+            'id': 'news-53',
+            'ext': 'mp4',
+            'title': 'Memory Bank:  Bradford Launch',
+            'thumbnail': r're:https://media\.yfanefa\.com/storage/v1/file/',
+        },
+    }, {
+        'url': 'https://www.yfanefa.com/evaluating_nature_matters',
+        'info_dict': {
+            'id': 'evaluating_nature_matters',
+            'ext': 'mp4',
+            'title': 'Evaluating Nature Matters',
+            'thumbnail': r're:https://media\.yfanefa\.com/storage/v1/file/',
+        },
+    }]
+
+    def _real_extract(self, url):
+        video_id = self._match_id(url)
+
+        webpage = self._download_webpage(url, video_id)
+        player_data = self._search_json(
+            r'iwPlayer\.options\["[\w.]+"\]\s*=', webpage, 'player options', video_id)
+
+        formats = []
+        video_url = join_nonempty(player_data['url'], player_data.get('signature'), delim='')
+        if determine_ext(video_url) == 'm3u8':
+            formats = self._extract_m3u8_formats(
+                video_url, video_id, 'mp4', m3u8_id='hls')
+        else:
+            formats = [{'url': video_url, 'ext': 'mp4'}]
+
+        return {
+            'id': video_id.strip('/').replace('/', '-'),
+            'title':
+                self._og_search_title(webpage, default=None)
+                or remove_end(self._html_extract_title(webpage), ' | Yorkshire Film Archive'),
+            'formats': formats,
+            **traverse_obj(player_data, {
+                'thumbnail': ('preview', {url_or_none}),
+                'duration': ('duration', {int_or_none}),
+            }),
+        }