2 жил өмнө · 0132eafca3
--- a/dulwich/object_store.py
+++ b/dulwich/object_store.py
@@ -780,7 +780,7 @@ class DiskObjectStore(PackBasedObjectStore):
 
				 
			
 
				         # Update the header with the new number of objects.
			
 
				         f.seek(0)
			
 
				-        write_pack_header(f, len(entries) + len(indexer.ext_refs()))
			
 
				+        write_pack_header(f.write, len(entries) + len(indexer.ext_refs()))
			
 
				 
			
 
				         # Must flush before reading (http://bugs.python.org/issue3207)
			
 
				         f.flush()
			
@@ -797,7 +797,7 @@ class DiskObjectStore(PackBasedObjectStore):
 
				             type_num, data = self.get_raw(ext_sha)
			
 
				             offset = f.tell()
			
 
				             crc32 = write_pack_object(
			
 
				-                f,
			
 
				+                f.write,
			
 
				                 type_num,
			
 
				                 data,
			
 
				                 sha=new_sha,
			
@@ -1047,7 +1047,7 @@ class MemoryObjectStore(BaseObjectStore):
 
				 
			
 
				         # Update the header with the new number of objects.
			
 
				         f.seek(0)
			
 
				-        write_pack_header(f, len(entries) + len(indexer.ext_refs()))
			
 
				+        write_pack_header(f.write, len(entries) + len(indexer.ext_refs()))
			
 
				 
			
 
				         # Rescan the rest of the pack, computing the SHA with the new header.
			
 
				         new_sha = compute_file_sha(f, end_ofs=-20)
			
@@ -1056,7 +1056,7 @@ class MemoryObjectStore(BaseObjectStore):
 
				         for ext_sha in indexer.ext_refs():
			
 
				             assert len(ext_sha) == 20
			
 
				             type_num, data = self.get_raw(ext_sha)
			
 
				-            write_pack_object(f, type_num, data, sha=new_sha)
			
 
				+            write_pack_object(f.write, type_num, data, sha=new_sha)
			
 
				         pack_sha = new_sha.digest()
			
 
				         f.write(pack_sha)
			
 
				 
			
--- a/dulwich/pack.py
+++ b/dulwich/pack.py
@@ -47,6 +47,7 @@ from itertools import chain
 
				 import os
			
 
				 import sys
			
 
				 from typing import Optional, Callable, Tuple, List
			
 
				+import warnings
			
 
				 
			
 
				 from hashlib import sha1
			
 
				 from os import (
			
@@ -1520,15 +1521,14 @@ def pack_object_header(type_num, delta_base, size):
 
				     return bytearray(header)
			
 
				 
			
 
				 
			
 
				-def write_pack_object(f, type, object, sha=None, compression_level=-1):
			
 
				-    """Write pack object to a file.
			
 
				+def pack_object_chunks(type, object, compression_level=-1):
			
 
				+    """Generate chunks for a pack object.
			
 
				 
			
 
				     Args:
			
 
				-      f: File to write to
			
 
				       type: Numeric type of the object
			
 
				       object: Object to write
			
 
				       compression_level: the zlib compression level
			
 
				-    Returns: Tuple with offset at which the object was written, and crc32
			
 
				+    Returns: Chunks
			
 
				     """
			
 
				     if type in DELTA_TYPES:
			
 
				         delta_base, object = object
			
@@ -1536,12 +1536,32 @@ def write_pack_object(f, type, object, sha=None, compression_level=-1):
 
				         delta_base = None
			
 
				     header = bytes(pack_object_header(type, delta_base, len(object)))
			
 
				     comp_data = zlib.compress(object, compression_level)
			
 
				-    crc32 = 0
			
 
				     for data in (header, comp_data):
			
 
				-        f.write(data)
			
 
				+        yield data
			
 
				+
			
 
				+
			
 
				+def write_pack_object(write, type, object, sha=None, compression_level=-1):
			
 
				+    """Write pack object to a file.
			
 
				+
			
 
				+    Args:
			
 
				+      write: Write function to use
			
 
				+      type: Numeric type of the object
			
 
				+      object: Object to write
			
 
				+      compression_level: the zlib compression level
			
 
				+    Returns: Tuple with offset at which the object was written, and crc32
			
 
				+    """
			
 
				+    if hasattr(write, 'write'):
			
 
				+        warnings.warn(
			
 
				+            'write_pack_object() now takes a write rather than file argument',
			
 
				+            DeprecationWarning, stacklevel=2)
			
 
				+        write = write.write
			
 
				+    crc32 = 0
			
 
				+    for chunk in pack_object_chunks(
			
 
				+            type, object, compression_level=compression_level):
			
 
				+        write(chunk)
			
 
				         if sha is not None:
			
 
				-            sha.update(data)
			
 
				-        crc32 = binascii.crc32(data, crc32)
			
 
				+            sha.update(chunk)
			
 
				+        crc32 = binascii.crc32(chunk, crc32)
			
 
				     return crc32 & 0xFFFFFFFF
			
 
				 
			
 
				 
			
@@ -1575,11 +1595,22 @@ def write_pack(
 
				         return data_sum, write_pack_index_v2(f, entries, data_sum)
			
 
				 
			
 
				 
			
 
				-def write_pack_header(f, num_objects):
			
 
				+def pack_header_chunks(num_objects):
			
 
				+    """Yield chunks for a pack header."""
			
 
				+    yield b"PACK"  # Pack header
			
 
				+    yield struct.pack(b">L", 2)  # Pack version
			
 
				+    yield struct.pack(b">L", num_objects)  # Number of objects in pack
			
 
				+
			
 
				+
			
 
				+def write_pack_header(write, num_objects):
			
 
				     """Write a pack header for the given number of objects."""
			
 
				-    f.write(b"PACK")  # Pack header
			
 
				-    f.write(struct.pack(b">L", 2))  # Pack version
			
 
				-    f.write(struct.pack(b">L", num_objects))  # Number of objects in pack
			
 
				+    if hasattr(write, 'write'):
			
 
				+        write = write.write
			
 
				+        warnings.warn(
			
 
				+            'write_pack_header() now takes a write rather than file argument',
			
 
				+            DeprecationWarning, stacklevel=2)
			
 
				+    for chunk in pack_header_chunks(num_objects):
			
 
				+        write(chunk)
			
 
				 
			
 
				 
			
 
				 def deltify_pack_objects(objects, window_size=None):
			
@@ -1697,11 +1728,11 @@ class PackChunkGenerator(object):
 
				         # Write the pack
			
 
				         if num_records is None:
			
 
				             num_records = len(records)
			
 
				-        f = BytesIO()
			
 
				-        write_pack_header(f, num_records)
			
 
				-        self.cs.update(f.getvalue())
			
 
				-        yield f.getvalue()
			
 
				-        offset = f.tell()
			
 
				+        offset = 0
			
 
				+        for chunk in pack_header_chunks(num_records):
			
 
				+            yield chunk
			
 
				+            self.cs.update(chunk)
			
 
				+            offset += len(chunk)
			
 
				         actual_num_records = 0
			
 
				         for i, (type_num, object_id, delta_base, raw) in enumerate(records):
			
 
				             if progress is not None:
			
@@ -1715,13 +1746,16 @@ class PackChunkGenerator(object):
 
				                 else:
			
 
				                     type_num = OFS_DELTA
			
 
				                     raw = (offset - base_offset, raw)
			
 
				-            f = BytesIO()
			
 
				-            crc32 = write_pack_object(f, type_num, raw, compression_level=compression_level)
			
 
				-            self.cs.update(f.getvalue())
			
 
				-            yield f.getvalue()
			
 
				+            crc32 = 0
			
 
				+            object_size = 0
			
 
				+            for chunk in pack_object_chunks(type_num, raw, compression_level=compression_level):
			
 
				+                yield chunk
			
 
				+                crc32 = binascii.crc32(chunk, crc32)
			
 
				+                self.cs.update(chunk)
			
 
				+                object_size += len(chunk)
			
 
				             actual_num_records += 1
			
 
				             self.entries[object_id] = (offset, crc32)
			
 
				-            offset += f.tell()
			
 
				+            offset += object_size
			
 
				         if actual_num_records != num_records:
			
 
				             raise AssertionError(
			
 
				                 'actual records written differs: %d != %d' % (
			
--- a/dulwich/tests/test_pack.py
+++ b/dulwich/tests/test_pack.py
@@ -498,7 +498,7 @@ class TestPack(PackTests):
 
				 
			
 
				             data._file.seek(12)
			
 
				             bad_file = BytesIO()
			
 
				-            write_pack_header(bad_file, 9999)
			
 
				+            write_pack_header(bad_file.write, 9999)
			
 
				             bad_file.write(data._file.read())
			
 
				             bad_file = BytesIO(bad_file.getvalue())
			
 
				             bad_data = PackData("", file=bad_file)
			
@@ -618,14 +618,14 @@ class TestThinPack(PackTests):
 
				 class WritePackTests(TestCase):
			
 
				     def test_write_pack_header(self):
			
 
				         f = BytesIO()
			
 
				-        write_pack_header(f, 42)
			
 
				+        write_pack_header(f.write, 42)
			
 
				         self.assertEqual(b"PACK\x00\x00\x00\x02\x00\x00\x00*", f.getvalue())
			
 
				 
			
 
				     def test_write_pack_object(self):
			
 
				         f = BytesIO()
			
 
				         f.write(b"header")
			
 
				         offset = f.tell()
			
 
				-        crc32 = write_pack_object(f, Blob.type_num, b"blob")
			
 
				+        crc32 = write_pack_object(f.write, Blob.type_num, b"blob")
			
 
				         self.assertEqual(crc32, zlib.crc32(f.getvalue()[6:]) & 0xFFFFFFFF)
			
 
				 
			
 
				         f.write(b"x")  # unpack_object needs extra trailing data.
			
@@ -643,7 +643,7 @@ class WritePackTests(TestCase):
 
				         offset = f.tell()
			
 
				         sha_a = sha1(b"foo")
			
 
				         sha_b = sha_a.copy()
			
 
				-        write_pack_object(f, Blob.type_num, b"blob", sha=sha_a)
			
 
				+        write_pack_object(f.write, Blob.type_num, b"blob", sha=sha_a)
			
 
				         self.assertNotEqual(sha_a.digest(), sha_b.digest())
			
 
				         sha_b.update(f.getvalue()[offset:])
			
 
				         self.assertEqual(sha_a.digest(), sha_b.digest())
			
@@ -654,7 +654,7 @@ class WritePackTests(TestCase):
 
				         offset = f.tell()
			
 
				         sha_a = sha1(b"foo")
			
 
				         sha_b = sha_a.copy()
			
 
				-        write_pack_object(f, Blob.type_num, b"blob", sha=sha_a, compression_level=6)
			
 
				+        write_pack_object(f.write, Blob.type_num, b"blob", sha=sha_a, compression_level=6)
			
 
				         self.assertNotEqual(sha_a.digest(), sha_b.digest())
			
 
				         sha_b.update(f.getvalue()[offset:])
			
 
				         self.assertEqual(sha_a.digest(), sha_b.digest())
			
--- a/dulwich/tests/utils.py
+++ b/dulwich/tests/utils.py
@@ -230,7 +230,7 @@ def build_pack(f, objects_spec, store=None):
 
				     """
			
 
				     sf = SHA1Writer(f)
			
 
				     num_objects = len(objects_spec)
			
 
				-    write_pack_header(sf, num_objects)
			
 
				+    write_pack_header(sf.write, num_objects)
			
 
				 
			
 
				     full_objects = {}
			
 
				     offsets = {}
			
@@ -270,7 +270,7 @@ def build_pack(f, objects_spec, store=None):
 
				                 base = obj_sha(base_type_num, base_data)
			
 
				             obj = (base, create_delta(base_data, data))
			
 
				 
			
 
				-        crc32 = write_pack_object(sf, type_num, obj)
			
 
				+        crc32 = write_pack_object(sf.write, type_num, obj)
			
 
				         offsets[i] = offset
			
 
				         crc32s[i] = crc32