ls-sensors et CPU Intel Core i9-13900H (13th Gen) : n° des cœurs étrange Le sujet est résolu

Demande d'aide : c'est ici.
Répondre
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

Bonjour,
J'ai un Intel Core i9-13900H (13th Gen) sur mon NUC, et j'ai installé Proxmox 8, donc base Debian 12.

J'ai installé lm-sensors pour récupérer les infos de températures, et le résultat me laisse perplexe.
Ce CPU possède 14 cœurs, et 20 threads.
Autant je vois ce que sont les coeurs, mais les threads ??
Mais ce n'est pas le propos de ma demande ici (bien qu'une réponse serait fortement appréciée).

Voilà le résultat de la commande :

Code : Tout sélectionner

 sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +30.0°C  (high = +100.0°C, crit = +100.0°C)
Core 0:        +23.0°C  (high = +100.0°C, crit = +100.0°C)
Core 4:        +27.0°C  (high = +100.0°C, crit = +100.0°C)
Core 8:        +24.0°C  (high = +100.0°C, crit = +100.0°C)
Core 12:       +28.0°C  (high = +100.0°C, crit = +100.0°C)
Core 16:       +27.0°C  (high = +100.0°C, crit = +100.0°C)
Core 20:       +25.0°C  (high = +100.0°C, crit = +100.0°C)
Core 24:       +27.0°C  (high = +100.0°C, crit = +100.0°C)
Core 25:       +27.0°C  (high = +100.0°C, crit = +100.0°C)
Core 26:       +27.0°C  (high = +100.0°C, crit = +100.0°C)
Core 27:       +27.0°C  (high = +100.0°C, crit = +100.0°C)
Core 28:       +25.0°C  (high = +100.0°C, crit = +100.0°C)
Core 29:       +25.0°C  (high = +100.0°C, crit = +100.0°C)
Core 30:       +25.0°C  (high = +100.0°C, crit = +100.0°C)
Core 31:       +25.0°C  (high = +100.0°C, crit = +100.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +27.8°C  (crit = +105.0°C)

iwlwifi_1-virtual-0
Adapter: Virtual device
temp1:            N/A

nvme-pci-0100
Adapter: PCI adapter
Composite:    +33.9°C  (low  = -273.1°C, high = +89.8°C)
                       (crit = +94.8°C)
Sensor 1:     +33.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +19.9°C  (low  = -273.1°C, high = +65261.8°C)
Cette numérotation me paraît quand même bien étrange...
J'ai même cru qu'il manquait des cœurs, mais en comptant bien, il y en a 14.
Les 8 de n°24 à n°31 semblent être les "Efficient-cores" et les 6 autres les "Performance-cores".

Sur un autre PC, avec un vieux Core i5-4690K, les cœurs sont numérotés de manière logique :

Code : Tout sélectionner

╰ sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +28.0°C  (high = +80.0°C, crit = +100.0°C)
Core 0:        +27.0°C  (high = +80.0°C, crit = +100.0°C)
Core 1:        +24.0°C  (high = +80.0°C, crit = +100.0°C)
Core 2:        +22.0°C  (high = +80.0°C, crit = +100.0°C)
Core 3:        +22.0°C  (high = +80.0°C, crit = +100.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +27.8°C  (crit = +105.0°C)
temp2:        +29.8°C  (crit = +105.0°C)

nvme-pci-0200
Adapter: PCI adapter
Composite:    +32.9°C  (low  = -273.1°C, high = +84.8°C)
                       (crit = +84.8°C)
Sensor 1:     +32.9°C  (low  = -273.1°C, high = +65261.8°C)
Sensor 2:     +32.9°C  (low  = -273.1°C, high = +65261.8°C)

Est-ce normal d'avoir cette numérotation particulière ?
Est-elle stable dans le temps ? (car je vais devoir faire une modification dans un fichier de configuration de proxmox pour afficher la température dans la Web-UI.)


Merci d'avance, et bonne journée
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 5854
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Belle machine!
Intel comme AMD peuvent lancer simultanément 2 treads (flux de calcul) par coeur, en pseudo parallèle, et donc le coeur matériel est vu comme 2 coeurs "virtuels".
C'est probablement ce que font les "Performancescore".
Généralement la numérotation ne change pas.
Nota: tu devrais baisser le seuil critique à 80°C.
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

Merci pour cette réponse :)
piratebab a écrit : 16 oct. 2023, 15:39 Belle machine!
Intel comme AMD peuvent lancer simultanément 2 treads (flux de calcul) par coeur, en pseudo parallèle, et donc le coeur matériel est vu comme 2 coeurs "virtuels".
C'est probablement ce que font les "Performancescore".
Généralement la numérotation ne change pas.
Nota: tu devrais baisser le seuil critique à 80°C.
Comment faire pour baisser ce seuil ?
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 5054
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
MilesTEG1 a écrit : 16 oct. 2023, 15:51 Comment faire pour baisser ce seuil ?

Dans le bios si je ne me trompe pas.
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 5854
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

C'est aussi comme ça que je le fais
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

Je me doutais que vous répondriez le bios ^^

Mais mon Bios est famélique en option...
Image
Image
Image
Image

I'm screwed :033:
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 5054
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Étrange...
Il n'y a pas une autre partie du Bios accessible avec un autre raccourcis au boot ?
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

Salut!

Et dans : "Fan mode" ?

Sur mon NUC à 150 balles il y a tout un tas de paramètres pour le réglage des seuils de température qui gère la vitesse du ventilateur
**Simple Utilisateur** -- Debian stable - XFCE
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

Malheureusement non il n’y a que ça :
Image
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

@piratebab

Question de Candide :

le réglage de ce seuil affiché par lm-sensors est censé déclencher qu'elle action concrète pour protéger d'une surchauffe ?
... juste l'affichage d'un quelconque voyant ou notification ?
ou une réelle action physique pour stopper la hausse de la température ?
**Simple Utilisateur** -- Debian stable - XFCE
Avatar de l’utilisateur
lol
Site Admin
Site Admin
Messages : 5054
Inscription : 04 avr. 2016, 12:11
Localisation : Madagascar
Status : Hors-ligne

Salut,
dezix a écrit : 16 oct. 2023, 20:44 @piratebab

Question de Candide :

le réglage de ce seuil affiché par lm-sensors est censé déclencher qu'elle action concrète pour protéger d'une surchauffe ?
... juste l'affichage d'un quelconque voyant ou notification ?
ou une réelle action physique pour stopper la hausse de la température ?
C'est du monitoring.
Il faut déployer des scripts derrière pour déclencher des actions.
Règles d'usage du forum. Signalez si vous avez posté votre question sur un autre forum. Explications ici
Debian Unstable. Mate/LXQT. Dieu, en créant l'homme, a quelque peu surestimé ses capacités.
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 5854
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Le kernel s'en sert pour baisser la fréquence d'horloge afin d'éviter d'aller au seuil de défaut (si paramétré comme ça). Au seuil max, le kernel peut arrêter la machine.
Au boot, le BIOS peut interdire le démarrage si processeur trop chaud (sur le mien on peux forcer avec la touche F1).

Quel est le modèle de la carte mère ?
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

piratebab a écrit : 17 oct. 2023, 08:56 Le kernel s'en sert pour baisser la fréquence d'horloge afin d'éviter d'aller au seuil de défaut (si paramétré comme ça). Au seuil max, le kernel peut arrêter la machine.
Au boot, le BIOS peut interdire le démarrage si processeur trop chaud (sur le mien on peux forcer avec la touche F1).

Quel est le modèle de la carte mère ?
Pour moi, il s'agit d'un NUC, donc une carte mère probablement fabriquée par le constructeur du NUC.
Avatar de l’utilisateur
dezix
Membre hyper actif
Membre hyper actif
Messages : 3548
Inscription : 04 juin 2016, 14:50
Status : Hors-ligne

Merci pour vos réponses.

Ce matin je suis allé visiter mon BIOS (NUC Intel) ; verdict hier j'ai écrit qu'il disposait d'un réglage de seuil T° CPU => c'est faux !
Il ne dispose que de la gestion du refroidissement : T° (cpu) seuil de démarrage du ventilo et accélération en fonction de la température (ça fonctionne très bien).

Côté lm-sensors ça affiche des seuils de 105°C qui sont les valeurs constructeur affichées dans cpu-world.com

Je me demande si cette valeur constructeur n'est pas "gravée dans le métal" ?

Code : Tout sélectionner

$ sensors
coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +42.0°C  (high = +105.0°C, crit = +105.0°C)
Core 0:        +42.0°C  (high = +105.0°C, crit = +105.0°C)
Core 1:        +42.0°C  (high = +105.0°C, crit = +105.0°C)
Core 2:        +42.0°C  (high = +105.0°C, crit = +105.0°C)
Core 3:        +42.0°C  (high = +105.0°C, crit = +105.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +42.0°C  (crit = +100.0°C)

iwlwifi_1-virtual-0
Adapter: Virtual device
temp1:            N/A  


J'ai recherché un peu comment modifier ces seuils high ; crit >> je n'ai trouvé que :

<How to increase kernel overheat threshold?

qui donne une réponse intéressante (que je n'ai pas épluché plus que ça).


Sinon : thermald(8) thermal-conf.xml(5)

ne donne pas de moyen pour diminuer les seuils,
juste les ignorer :
thermald(8)

--ignore-critical-trip
If the configuration defined a critical temperature point, which is too low, this option will avoid shutting down the system on reaching this temperature limit.
**Simple Utilisateur** -- Debian stable - XFCE
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 5854
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

Pour voir ce que la machine possède comme capacité matérielle, linux propose plusieurs commandes

Code : Tout sélectionner

$ cat /sys/devices/virtual/dmi/id/board_{vendor,name,version}
#dmidecode -t 2
# lshw
Est ce que vous avez installé les microcode intel ?
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

En ce qui me concerne, je ne crois pas avoir installé les "microcodes" intel.
Comment doit-on procéder ?
Avatar de l’utilisateur
piratebab
Site Admin
Site Admin
Messages : 5854
Inscription : 24 avr. 2016, 18:41
Localisation : sud ouest
Status : En ligne

avec la commande apt :)
https://packages.debian.org/bookworm/intel-microcode

il faut activer les dépots non-free-firmware
MilesTEG1
Messages : 7
Inscription : 16 oct. 2023, 12:38
Status : Hors-ligne

piratebab a écrit : 17 oct. 2023, 13:55 avec la commande apt :)
https://packages.debian.org/bookworm/intel-microcode

il faut activer les dépots non-free-firmware
Voilà, installé.

Question annexe : avez-vous une idée sur comment passer l'iGPU du CPU à une machine virtuelle ? (je précise que j'ai proxmox 8).
Répondre