Cuál es la diferencia de sección y segmento en formato de archivo ELF

Del formato ejecutable y enlazable de wiki:

Los segmentos contienen información que es necesaria para la ejecución del archivo en tiempo de ejecución, mientras que las secciones contienen datos importantes para vincular y reubicar. Cualquier byte en el archivo completo puede pertenecer como máximo a una sección, y puede haber bytes huérfanos que no pertenecen a ninguna sección.

¿Pero cuál es la diferencia entre sección y segmento? En un archivo ELF ejecutable, ¿un segmento contiene una o más secciones?

¿Pero cuál es la diferencia entre sección y segmento?

Exactamente lo que citó: los segmentos contienen información necesaria en tiempo de ejecución, mientras que las secciones contienen información necesaria durante el enlace.

¿un segmento contiene una o más secciones?

Un segmento puede contener 0 o más secciones. Ejemplo:

readelf -l /bin/date Elf file type is EXEC (Executable file) Entry point 0x402000 There are 9 program headers, starting at offset 64 Program Headers: Type Offset VirtAddr PhysAddr FileSiz MemSiz Flags Align PHDR 0x0000000000000040 0x0000000000400040 0x0000000000400040 0x00000000000001f8 0x00000000000001f8 RE 8 INTERP 0x0000000000000238 0x0000000000400238 0x0000000000400238 0x000000000000001c 0x000000000000001c R 1 [Requesting program interpreter: /lib64/ld-linux-x86-64.so.2] LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000 0x000000000000d5ac 0x000000000000d5ac RE 200000 LOAD 0x000000000000de10 0x000000000060de10 0x000000000060de10 0x0000000000000440 0x0000000000000610 RW 200000 DYNAMIC 0x000000000000de38 0x000000000060de38 0x000000000060de38 0x00000000000001a0 0x00000000000001a0 RW 8 NOTE 0x0000000000000254 0x0000000000400254 0x0000000000400254 0x0000000000000044 0x0000000000000044 R 4 GNU_EH_FRAME 0x000000000000c700 0x000000000040c700 0x000000000040c700 0x00000000000002a4 0x00000000000002a4 R 4 GNU_STACK 0x0000000000000000 0x0000000000000000 0x0000000000000000 0x0000000000000000 0x0000000000000000 RW 8 GNU_RELRO 0x000000000000de10 0x000000000060de10 0x000000000060de10 0x00000000000001f0 0x00000000000001f0 R 1 Section to Segment mapping: Segment Sections... 00 01 .interp 02 .interp .note.ABI-tag .note.gnu.build-id .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame 03 .ctors .dtors .jcr .dynamic .got .got.plt .data .bss 04 .dynamic 05 .note.ABI-tag .note.gnu.build-id 06 .eh_frame_hdr 07 08 .ctors .dtors .jcr .dynamic .got 

Aquí, el segmento PHDR contiene 0 secciones, el segmento INTERP contiene la sección .interp , y el primer segmento LOAD contiene un montón de secciones.

Lectura adicional con una bonita ilustración .

La sección contiene información estática para el vinculador, datos dynamics de segmento para el sistema operativo

La cita es correcta, pero para comprender realmente la diferencia, debe intentar comprender los campos de las entradas de encabezado de sección y encabezado de progtwig (segmento) y cómo deben ser utilizados por el enlazador (secciones) y el sistema operativo (segmento) .

Informaciones particularmente importantes son (además de las longitudes):

  • sección: dile al vinculador si una sección es:

    • datos sin procesar que se .text en la memoria, por ejemplo, .data , .text , etc.
    • o metadatos formateados sobre otras secciones, que serán utilizados por el enlazador, pero desaparecerán en el tiempo de ejecución, por ejemplo, .srttab , .rela.text , .rela.text
  • segmento: le dice al sistema operativo:

    • dónde debe cargarse un segmento en la memoria virtual
    • qué permisos tienen los segmentos (leer, escribir, ejecutar). Recuerde que esto puede ser aplicado de manera eficiente por el procesador: ¿Cómo funciona la búsqueda x86?

He escrito un tutorial que cubre eso con más detalle en: http://www.cirosantilli.com/elf-hello-world/

¿Un segmento contiene una o más secciones?

Sí, y es el enlazador el que coloca las secciones en segmentos.

En Binutils, la forma en que las secciones se colocan en segmentos por ld viene determinada por un archivo de texto llamado secuencia de comandos del enlazador . Documentos: https://sourceware.org/binutils/docs/ld/Scripts.html

Puede obtener el predeterminado con ld --verbose , y establecer uno personalizado con -T .

Por ejemplo, mi script del enlazador predeterminado de Ubuntu 17.04 contiene:

  .text : { *(.text.unlikely .text.*_unlikely .text.unlikely.*) *(.text.exit .text.exit.*) *(.text.startup .text.startup.*) *(.text.hot .text.hot.*) *(.text .stub .text.* .gnu.linkonce.t.*) } 

que le dice al enlazador que ponga secciones llamadas .text.unlikely , .text.*_unlikely , .text.exit , etc. en el segmento .text .

El desarrollo de SO es un caso donde los scripts personalizados son útiles, un ejemplo mínimo: https://github.com/cirosantilli/x86-bare-metal-examples/blob/d217b180be4220a0b4a453f31275d38e697a99e0/linker.ld

Una vez que el ejecutable está vinculado, solo es posible saber qué sección fue para cada segmento si el vinculador almacena el encabezado de sección opcional en el archivo ejecutable: ¿Dónde está almacenada la “Sección para mapeo de segmentos” en archivos ELF?