Formato de arquivo XZ

XZ é um formato de arquivo de alta compactação usado principalmente para compactar arquivos únicos, oferecendo eficiência de compactação superior e compatibilidade de código aberto. Desenvolvido como parte do XZ Utils, este formato é conhecido pelo uso do algoritmo de compressão LZMA2, que atinge altas taxas de compressão enquanto mantém velocidades de descompressão razoáveis. Os arquivos XZ são amplamente utilizados na distribuição de pacotes de software, especialmente em sistemas operacionais do tipo Unix, como o Linux.

Informações gerais do arquivo XZ

Arquivos XZ foram projetados para fornecer compactação eficiente com foco na redução do tamanho dos arquivos para armazenamento e distribuição. O formato usa o algoritmo LZMA2, que combina compactação de dicionário e codificação de entropia, tornando-o altamente eficaz para compactar arquivos grandes. Os arquivos XZ normalmente contêm um único arquivo compactado, mas podem ser combinados com outras ferramentas como tar para compactar diretórios inteiros. O formato XZ é frequentemente usado na distribuição de software, backup de dados e arquivamento, especialmente no ecossistema Linux, onde se tornou um padrão para empacotamento de software e atualizações de sistema.

Informações históricas do XZ

  • 2005: O formato XZ iniciou o desenvolvimento como parte do projeto XZ Utils, que visava criar um sucessor mais eficiente do antigo formato LZMA.
  • 2009: XZ Utils foi lançado oficialmente, introduzindo o formato XZ como um novo padrão para necessidades de alta compactação.
  • 2010: XZ começou a ganhar popularidade na comunidade Linux, tornando-se rapidamente o formato preferido para compactar pacotes de software e arquivos de sistema.
  • 2011: As principais distribuições Linux, incluindo Debian e Arch Linux, começaram a adotar XZ como formato de compactação padrão para seus repositórios de pacotes.
  • 2014: O uso do XZ se expandiu além do Linux, tornando-se popular para distribuição de software multiplataforma, especialmente para aplicativos que exigem altas taxas de compactação.
  • 2020: XZ continua amplamente utilizado em empacotamento de software, armazenamento e distribuição de dados, especialmente em ambientes onde a compactação eficiente é crítica.

Estrutura do arquivo XZ

O formato de arquivo XZ foi projetado para compactação de arquivo único e usa uma estrutura simples para atingir altas taxas de compactação. Aqui está uma visão geral da estrutura de um arquivo XZ:

  1. Cabeçalho: O cabeçalho contém metadados sobre o arquivo XZ, incluindo a versão do formato, sinalizadores e quaisquer extensões opcionais usadas. Também indica a presença de somas de verificação para integridade dos dados.
  2. Fluxo de dados compactados: O núcleo do arquivo XZ é o fluxo de dados compactados. Esta seção contém os dados reais do arquivo, compactados usando o algoritmo LZMA2. O fluxo de dados é dividido em blocos, permitindo compactação e descompactação eficientes. Cada bloco pode ser descompactado de forma independente, o que ajuda na recuperação de dados mesmo que o arquivo esteja parcialmente corrompido.
  3. Rodapé: O rodapé inclui uma soma de verificação CRC32 que verifica a integridade do arquivo. Também marca o fim do fluxo de dados compactados e pode conter informações adicionais, como um índice de blocos para acesso rápido.

Métodos de compressão XZ

O formato XZ depende principalmente do algoritmo de compactação LZMA2, conhecido por sua alta taxa de compactação e velocidade de descompressão razoável. Aqui está uma visão mais detalhada dos métodos de compactação associados ao XZ:

  1. LZMA2: Este é o método de compactação padrão e único usado pelos arquivos XZ. LZMA2 baseia-se no algoritmo LZ77 e incorpora codificação de entropia avançada, tornando-o altamente eficiente na compactação de arquivos grandes. Ele oferece configurações de compactação ajustáveis, permitindo aos usuários priorizar a velocidade ou taxa de compactação dependendo de suas necessidades.
  2. Filtros: Além de LZMA2 , o XZ suporta vários filtros opcionais que podem ser aplicados antes da compactação para reduzir ainda mais o tamanho do arquivo. Isso inclui a codificação delta, que é útil para compactar dados que apresentam alterações pequenas e repetidas, e BCJ (Branch/Call/Jump), que otimiza a compactação de código executável, transformando certas instruções em formatos mais compactáveis.
  3. Somas de verificação CRC32 e SHA-256: Embora não sejam métodos de compactação em si, os arquivos XZ usam somas de verificação CRC32 para verificações de integridade e, opcionalmente, suportam SHA-256 para verificação aprimorada de dados, garantindo que os dados compactados não tenham sido corrompidos ou adulterados.

.xz Operações Suportadas

Aspose.Zip oferece suporte abrangente para trabalhar com arquivos .xz, facilitando o gerenciamento de arquivos compactados. Aqui está o que você pode fazer:

  • Extração completa: Extraia facilmente todos os arquivos de um arquivo .xz, preservando a integridade e a estrutura do conteúdo original.
  • Extração seletiva: Direcione arquivos específicos em um arquivo .xz, permitindo recuperação precisa de dados ou descompactação seletiva com base em nomes de arquivos ou outros critérios.
  • Compactação de dados: Crie arquivos .xz a partir de arquivos e diretórios, utilizando o método eficiente de compactação LZMA2 para reduzir significativamente o tamanho dos arquivos.
  • Configurações de compactação personalizadas: Ajuste os níveis de compactação e outros parâmetros para equilibrar a velocidade de compactação e o tamanho do arquivo, adaptando o processo às suas necessidades específicas.

Estrutura do arquivo .XZ

O formato de arquivo .xz é usado principalmente para compactação e empacotamento de dados. Ele emprega o algoritmo LZMA2 para atingir altas taxas de compressão. Aqui está uma visão geral da estrutura de um arquivo .xz:

  1. Cabeçalho da transmissão:

    • Magic Bytes: Os primeiros 6 bytes (FD 37 7A 58 5A 00) identificam o arquivo como um arquivo .xz.
    • Stream Flags: Inclui detalhes como tamanho do bloco e opções de compactação.
  2. Cabeçalho do bloco:

    • Block Size: Indica o tamanho do bloco que segue.
    • Método de Compressão: Especifica o algoritmo utilizado (geralmente LZMA2).
    • Cadeias de filtros: detalha quaisquer filtros adicionais aplicados antes ou depois da compactação.
  3. Blocos de dados compactados:

    • Dados: Os dados reais compactados usando o algoritmo LZMA2.
    • CRC32: Uma soma de verificação usada para verificar a integridade dos dados compactados.
  4. Seção de Índice:

    • Dados de índice: Fornece deslocamentos para cada bloco e o tamanho não compactado, permitindo acesso aleatório dentro do fluxo compactado.
    • Índice CRC32: Garante a integridade da seção do índice.
  5. Rodapé da transmissão:

    • Stream Flags: Repete os sinalizadores de stream do cabeçalho para fins de validação.
    • Tamanho retroativo: O tamanho da seção do índice, permitindo o percurso reverso do arquivo.
    • Bytes Mágicos: O arquivo termina com uma sequência de 2 bytes (59 5A) para indicar o fim do arquivo .xz.
  6. Metadados opcionais:

    • Alguns arquivos .xz podem incluir metadados adicionais para recursos especiais ou funcionalidades estendidas, como filtros personalizados ou criptografia.

Estrutura do arquivo .XZ

Popularidade do formato XZ

O formato de arquivo .xz ganhou popularidade significativa, especialmente nas comunidades Linux e de código aberto, devido à sua alta taxa de compactação e uso eficiente de recursos. É amplamente utilizado para compactar pacotes de software, distribuir código-fonte e arquivar grandes conjuntos de dados. O conjunto de ferramentas XZ Utils fornece suporte robusto para criação, extração e gerenciamento de arquivos .xz em várias plataformas, incluindo Linux, macOS e Windows. Embora não seja tão amplamente adotado em ambientes Windows como ZIP ou CAB , .xz é apreciado por seu equilíbrio entre eficácia de compactação e desempenho, tornando-o uma escolha preferida para desenvolvedores e administradores de sistema. Além disso, .xz está integrado em muitos sistemas de gerenciamento de pacotes, como o APT do Debian e o Pacman do Arch Linux, consolidando ainda mais seu papel no ecossistema de distribuição de software.

Exemplos de uso de arquivos XZ

Esta seção fornece exemplos de código que demonstram como compactar e descompactar arquivos XZ usando C# e Java. Esses exemplos utilizam bibliotecas como Aspose.Zip para C# e a classe XzArchive integrada (dependendo do ambiente Java) para interagir com arquivos XZ.

Compress XZ File via C#

    using (FileStream xzFile = File.Open("data.bin.xz", FileMode.Create))
    {
        using (FileStream source = File.Open("data.bin", FileMode.Open, FileAccess.Read))
        {
            using (var archive = new XzArchive(Aspose.Zip.Xz.Settings.XzArchiveSettings.FastestSpeed))
            {
                archive.SetSource(source);
                archive.Save(xzFile);
            }
        }
    }

Open XZ Archive via C#

    using (var archive = new XzArchive("data.bin.xz"))
    {
        archive.Extract("data.bin");
    }

Compress XZ File via C#

    try (FileOutputStream xzFile = new FileOutputStream("data.bin.xz")) {
        try (FileInputStream source = new FileInputStream("data.bin")) {
            try (XzArchive archive = new XzArchive(XzArchiveSettings.getFastestSpeed())) {
                archive.setSource(source);
                archive.save(xzFile);
            }
        }
    } catch (IOException ex) {
    }

Open XZ Archive via Java

    try (XzArchive archive = new XzArchive("data.bin.xz")) {
        archive.extract("data.bin");
    }

Aspose.Zip offers individual archive processing APIs for popular development environments, listed below:

Aspose.Zip for .NETAspose.Zip via JavaAspose.Zip via Python.NET

Informações adicionais

As pessoas têm perguntado

1. O .xz é compatível com todos os sistemas operacionais?

Embora .xz seja mais comumente usado em ambientes Linux, ele é compatível com todos os principais sistemas operacionais. Ferramentas como XZ Utils estão disponíveis para Windows e macOS, e ferramentas multiplataforma como 7-Zip também suportam Arquivos .xz.

2. Quais são as vantagens de usar arquivos XZ?

Os arquivos XZ oferecem diversas vantagens, incluindo altas taxas de compactação, uso eficiente dos recursos do sistema e compatibilidade entre plataformas. Eles são comumente usados ​​para arquivar grandes conjuntos de dados, distribuir pacotes de software e fazer backup de dados.

3. Posso compactar vários arquivos em um único arquivo .xz?

Ao contrário de formatos como ZIP ou TAR , .xz normalmente é usado para compactar um único arquivo. Se quiser compactar vários arquivos, primeiro você precisa arquivá-los em um único arquivo (usando uma API Aspose.Zip para criar um arquivo .tar ) e, em seguida, compactar o arquivo usando .xz, resultando em um arquivo .tar.xz.