(extensions.archives) more work on respawn.RPak

snake-biscuits · Jul 9, 2024 · ec3c17c · ec3c17c
1 parent 92c013b
commit ec3c17c
Show file tree

Hide file tree

Showing 2 changed files with 281 additions and 57 deletions.
diff --git a/bsp_tool/extensions/archives/respawn.py → ...l/extensions/archives/respawn/__init__.py b/bsp_tool/extensions/archives/respawn.py → ...l/extensions/archives/respawn/__init__.py
@@ -1,65 +1,14 @@
 from __future__ import annotations
-import enum
 import io
 import os
 from typing import Dict, List, Tuple
 
-from ...utils.binary import read_str, read_struct
-from . import base
-
-
-# TODO: determine actual partial flags (e.g. 0x01 == UI)
-class RPakTypev7(enum.IntFlag):
-    """observed, could be wrong in some way"""
-    SKIN = 0x0000
-    UI = 0x0101
-    COMMON = 0x0100
-
-
-class RPakTypev8(enum.IntFlag):
-    """observed (8 July 2024), could be wrong in some way"""
-    SKIN = 0x0000  # haven't checked for exceptions
-    CLIENT_TEMP = 0x0024  # entities & rendered geo
-    STARTUP = 0x0224  # also some client_temp
-    UI = 0x0225
-    PRIORITY_MAP = 0x0228  # lobby & firing range materials
-    COMMON_MAP = 0x022C  # client_perm, startup, scripts etc.
-
-
-class RPak(base.Archive):
-    # Apex Season 18 & onwards store .bsp files in "wrap" (oodle compression)
-    # shadersets, materials, textures & models for io_import_rbsp
-    ext = "*.rpak"  # + "*.starpak"
-    version: int
-
-    _versions = {
-        7: "Titanfall 2",
-        8: "Apex Legends"}
-
-    def __init__(self, filename: str):
-        with open(filename, "rb") as rpak_file:
-            self._from_stream(rpak_file)
-
-    def __repr__(self) -> str:
-        return f"<RPak v{self.version} ({self.type.name}) ??? files @ 0x{id(self):016X}>"
-
-    def _from_stream(self, stream: io.BytesIO):
-        assert stream.read(4) == b"RPak"
-        self.version = read_struct(stream, "H")
-        assert self.version in self._versions, f"unknown version: {self.version}"
-        type_ = read_struct(stream, "H")
-        if self.version == 7:
-            self.type = RPakTypev7(type_)
-        elif self.version == 8:
-            self.type = RPakTypev8(type_)
-        else:
-            self.type = type_
-        # TODO: parse the rest of the header
-        # -- list all assets etc.
+from ....utils.binary import read_str, read_struct
+from .. import base
+from .rpak import RPak
+
 
-    # TODO: extract()
-    # TODO: namelist()
-    # TODO: read()
+__all__ = ["RPak", "Vpk"]
 
 
 class Vpk(base.Archive):
@@ -130,7 +79,7 @@ def read(self, filename: str) -> bytes:
     def extract(self, filename: str, path=None):
         assert filename in self.files
         if path is not None:
-            raise NotImplementedError("Cannot target a out folder yet")
+            raise NotImplementedError("Cannot target an out folder yet")
         raise NotImplementedError()
         with open(os.path.join("" if path is None else path, filename), "w") as out_file:
             out_file.write(self.read(filename))

diff --git a/bsp_tool/extensions/archives/respawn/rpak.py b/bsp_tool/extensions/archives/respawn/rpak.py
@@ -0,0 +1,275 @@
+# https://github.com/r-ex/LegionPlus/
+import datetime
+import enum
+import io
+import os
+from typing import List, Tuple, Union
+
+from ....branches.base import MappedArray
+from ....utils.binary import read_struct
+from .. import base
+
+
+versions = {
+    6: "Titanfall 2 Tech Test",
+    7: "Titanfall 2",
+    8: "Apex Legends"}
+
+
+class Compression(enum.Enum):
+    NONE = 0x00
+    RESPAWN = 0x01  # LZHAM?
+    OODLE = 0x02
+
+
+class FileTime:
+    # NOTE: FILETIME epoch is 1601-01-01
+    epoch_offset = 0x019DB1DED53E8000  # 1970-01-01 as FILETIME
+
+    def __init__(self, value):
+        self.value = value
+
+    def __repr__(self) -> str:
+        time_string = self.as_datetime().strftime("%Y/%m/%d (%a) %H:%M:%S.%f")
+        return f"<{self.__class__.__name__} {time_string}>"
+
+    def __iter__(self):  # for struct.as_bytes
+        return iter([self.value])
+
+    def as_datetime(self) -> datetime.datetime:
+        timestamp = (self.value - self.epoch_offset) / (10 ** 7)  # 100s of ns -> seconds
+        return datetime.datetime.utcfromtimestamp(timestamp)
+
+    # TODO: .from_datetime / .now @classmethod(s)
+
+
+class HeaderFlags(enum.IntFlag):
+    """all guesses"""
+    # NOTE: R5 flags only use the bottom byte
+    # TODO: r2tt
+    # r2
+    SKIN = 0x0000  # haven't checked r5 for exceptions
+    UI = 0x0001
+    COMMON_R2 = 0x0100
+    # r5
+    UNKNOWN_1 = 0x04  # entities & rendered geo + startup.rpak
+    UNKNOWN_2 = 0x08  # lobby & firing range temp & materials
+    R5 = 0x20  # always present (for season 21 anyway)
+
+
+# other header data
+class PatchHeader(MappedArray):
+    data_size: int  # "total size of the patch edit stream data"
+    virtual_segment: int  # index into VirtualSegments
+    _mapping = ["data_size", "virtual_segment"]
+    _format = "2I"
+
+
+class CompressPair(MappedArray):
+    _mapping = ["compressed_size", "decompressed_size"]
+    _format = "2Q"
+
+
+class VirtualSegment(MappedArray):
+    _mapping = ["flags", "type", "size"]
+    _format = "2IQ"
+    # TODO: flags & type enums
+
+
+class MemoryPage(MappedArray):
+    _mapping = ["virtual_segment", "flags", "size"]
+    _format = "3I"
+    # TODO: flags enum
+
+
+class Descriptor(MappedArray):
+    _mapping = ["index", "offset"]
+    _format = "2I"
+
+
+# versioned headers
+class AssetEntryv6(MappedArray):  # also v7
+    _mapping = [
+        "name_hash", "unknown_1", "head_index", "head_offset", "cpu_index", "cpu_offset",
+        "starpak_offset", "last_page", "unknown_2",
+        "first_relation", "uses_start_index", "num_relations", "uses_count",
+        "subheader_size", "version", "magic"]
+    _format = "2Q4IQ2H6I4s"
+
+    def __repr__(self) -> str:
+        return f"<AssetEntryv6 {self.magic.decode()}_{self.name_hash:016X} @ 0x{id(self):016X}>"
+
+
+class AssetEntryv8(MappedArray):
+    _mapping = [
+        "name_hash", "unknown", "head_index", "head_offset", "cpu_index", "cpu_offset",
+        "starpak_offset", "optimal_starpak_offset", "last_page", "unknown",
+        "first_relation", "uses_start_index", "num_relations", "uses_count",
+        "subheader_size", "version", "magic"]
+    _format = "2Q4i2q2h6I4s"
+
+    def __repr__(self) -> str:
+        return f"<AssetEntryv8 {self.magic.decode()}_{self.name_hash:016X} @ 0x{id(self):016X}>"
+
+
+class RPakHeaderv6(MappedArray):
+    """Titanfall 2 Tech Test"""
+    magic: bytes  # always b"RPak"
+    version: int  # always 6
+    flags: HeaderFlags
+    # notes
+    num_unknown_1: int  # length of penultimate uint32_t header block
+    num_unknown_2: int  # bytesize of final header block
+    # defaults
+    # TODO: compression
+    patch_index: int = 0
+
+    _mapping = [
+        "magic", "version", "flags", "created", "hash",
+        "file_size", "padding_1", "padding_2",
+        "len_starpak_ref", "num_virtual_segments", "num_memory_pages",
+        "num_descriptors", "num_asset_entries", "num_guid_descriptors",
+        "num_relations", "num_unknown_1", "num_unknown_2", "unknown"]
+    _format = "4s2H5Q10I"
+    _classes = {"flags": HeaderFlags, "created": FileTime}
+
+
+class RPakHeaderv7(MappedArray):
+    """Titanfall 2"""
+    magic: bytes  # always b"RPak"
+    version: int  # always 7
+    flags: HeaderFlags
+    # notes
+    num_unknown_1: int  # length of penultimate uint32_t header block
+    num_unknown_2: int  # bytesize of final header block
+    # NOTE: compression is a @property
+
+    _mapping = [
+        "magic", "version", "flags", "created", "hash",
+        "compressed_size", "padding_1", "decompressed_size", "padding_2",
+        "len_starpak_ref", "num_virtual_segments", "num_memory_pages", "patch_index",
+        "num_descriptors", "num_asset_entries", "num_guid_descriptors",
+        "num_relations", "num_unknown_1", "num_unknown_2"]
+    _format = "4s2H6Q4H6I"
+    _classes = {"flags": HeaderFlags, "created": FileTime}
+
+    @property
+    def compression(self) -> Compression:
+        return Compression.NONE if self.compressed_size == self.decompressed_size else Compression.RESPAWN
+
+
+class RPakHeaderv8(MappedArray):
+    """Apex Legends"""
+    magic: bytes  # always b"RPak"
+    version: int  # always 8
+    flags: HeaderFlags
+    compression: Compression
+
+    _mapping = [
+        "magic", "version", "flags", "compression", "created", "hash",
+        "compressed_size", "starpak_offset", "padding_1",
+        "decompressed_size", "starpak_size", "padding_2",
+        "len_starpak_ref", "len_opt_starpak_ref", "num_virtual_segments", "num_memory_pages",
+        "patch_index", "num_descriptors", "num_asset_entries", "num_guid_descriptors",
+        "num_relations", "unknown"]
+    # TODO: unknown -> {uint8_t unk1[10]; uint32_t page_offset; uint8_t unk2[8];}  // hidden alignment cost
+    _format = "4sH2B8Q4H5I28s"
+    _classes = {"flags": HeaderFlags, "compression": Compression, "created": FileTime}
+
+
+class RPak(base.Archive):
+    ext = "*.rpak"  # + "*.starpak"
+    version: int
+    header: Union[RPakHeaderv6, RPakHeaderv7, RPakHeaderv8]
+    starpaks: List[str]
+    optimal_starpaks: List[str] = list()
+    patch: Tuple[PatchHeader, List[CompressPair], List[int]] = None
+    # versioned struct lookups
+    HeaderClasses = {
+        6: RPakHeaderv6,
+        7: RPakHeaderv7,
+        8: RPakHeaderv8}
+    # ^ {version: RPakHeader}
+    AssetEntryClasses = {
+        6: AssetEntryv6,
+        7: AssetEntryv6,
+        8: AssetEntryv8}
+    # ^ {version: AssetEntry}
+
+    def __init__(self, filename: str):
+        with open(filename, "rb") as rpak_file:
+            self._from_stream(rpak_file)
+
+    def __repr__(self) -> str:
+        hash = f"{self.header.hash:016X}"
+        num_assets = self.header.num_asset_entries
+        # num_assets = len(self.asset_entries)  # can't use until we have decompression
+        return f"<RPak v{self.version} ({hash}) {num_assets} assets @ 0x{id(self):016X}>"
+
+    def _from_stream(self, stream: io.BytesIO):
+        assert read_struct(stream, "4s") == b"RPak", "not a RPak file!"
+        self.version = read_struct(stream, "H")
+        assert self.version in versions, f"unknown version: {self.version}"
+        stream.seek(-6, 1)  # back to the start
+        HeaderClass = self.HeaderClasses[self.version]
+        self.header = HeaderClass.from_stream(stream)
+        assert self.header.patch_index < 16
+        if self.header.patch_index > 0:
+            self.patch = (
+                PatchHeader.from_stream(stream),
+                [CompressPair.from_stream(stream) for i in range(self.header.patch_index)],
+                [read_struct(stream, "H") for i in range(self.header.patch_index)])  # "IndicesToFile"
+        # TODO: decompress everything after the main header
+        if self.header.compression is not Compression.NONE:
+            # uncompressed_rpak = b"".join([
+            #     self.header.as_bytes(),
+            #     decompress(self.header, stream)])  # TODO
+            # stream = io.BytesIO(uncompressed_rpak)
+            # stream.seek(len(self.header.as_bytes()))
+            return  # NotImplemented
+        # StaRPak references
+        self.starpaks = [
+            fn.decode("utf-8", "strict")
+            for fn in stream.read(self.header.len_starpak_ref)[:-1].split(b"\0")]
+        if self.version == 8:
+            self.optimal_starpaks = [
+                fn.decode("utf-8", "strict")
+                for fn in stream.read(self.header.len_opt_starpak_ref)[:-1].split(b"\0")]
+        self.virtual_segments = [
+            VirtualSegment.from_stream(stream)
+            for i in range(self.header.num_virtual_segments)]
+        self.memory_pages = [
+            MemoryPage.from_stream(stream)
+            for i in range(self.header.num_memory_pages)]
+        self.descriptors = [
+            Descriptor.from_stream(stream)
+            for i in range(self.header.num_descriptors)]
+        AssetEntryClass = self.AssetEntryClasses[self.version]
+        self.asset_entries = [
+            AssetEntryClass.from_stream(stream)
+            for i in range(self.header.num_asset_entries)]
+        self.guid_descriptors = [
+            Descriptor.from_stream(stream)
+            for i in range(self.header.num_guid_descriptors)]
+        self.relations = read_struct(stream, f"{self.header.num_relations}I")
+        # TODO: parse the rest of the file
+
+    def extract(self, filepath: str, path=None):
+        assert filepath in self.namelist()
+        if path is not None:
+            raise NotImplementedError("Cannot target an out folder yet")
+        raise NotImplementedError()
+        with open(os.path.join("" if path is None else path, filepath), "w") as out_file:
+            out_file.write(self.read(filepath))
+
+    def namelist(self) -> List[str]:
+        # we cannot reverse name hashes
+        # true filenames have to be derived from StarPak assets
+        if self.header.compression is not Compression.NONE:
+            raise NotImplementedError("cannot decompress asset_entries")
+        else:
+            return sorted(f"{ae.magic.decode()}_{ae.name_hash:016X}" for ae in self.asset_entries)
+
+    def read(self, filepath: str) -> bytes:
+        assert filepath in self.namelist()
+        raise NotImplementedError("cannot parse StaRPak")