Application De La Regression Logistique Binaire Floue A L’estimation De L’esperance De Vie Des Chomeurs Dans Certaines Communes De Kinshasa En Integrant Le Langage Linguistique Flou Utilise Par Les Kinois

Hedrezy Kapata

doi:10.18535/ijsrm/v14i05.m03

Abstract

This study focuses on the application of fuzzy binary logistic regression to the estimation of the life expectancy of unemployed people in selected municipalities of Kinshasa ; data related to the socio-economic conditions of the population are often expressed through qualitative and subjective formulations derived from urban lingala. This situation makes it difficult to apply classical statistical methods based strictly on quantitative data. The general objective of this study is to analyze and estimate the life expectancy of unemployed people using fuzzy binary logistic regression while taking into account the linguistic fuzziness specific to the kinshasa people language. The methodology is based on the fuzzy logic theory developed by Lotfi Zadeh as well as on the transformation of linguistic expressions into triangular, trapezoidal, and Gaussian membership functions. The illustrative results show that the integration of fuzzy variables improves the representation of social realities observed in surveys conducted among Kinshasa populations. This approach also makes it possible to better model phenomena characterized by uncertainty and linguistic imprecision.

Keywords

fuzzy logic fuzzy binary logistic regression unemployment life expectancy Kinshasa people language Kinshasa.

Introduction

A Kinshasa, capitale de la République Démocratique du Congo, la communication quotidienne est dominée par l’usage du lingala, qui constitue l’une des principales langues vernaculaires urbaines. Toutefois, le Lingala parlé à Kinshasa présente des particularités linguistiques qui le distinguent sensiblement de celui utilisé dans d’autres régions du pays.

En effet, ce parler urbain est fortement influencé par le Français ainsi que par d’autres langues nationales telles que le Kikongo, le Tshiluba et le Swahili. Cette dynamique linguistique favorise l’apparition d’expressions hybrides, des néologismes et d’emprunts lexicaux qui constituent un jargon spécifique souvent associé au langage urbain de « yankees ».

Dans ce contexte sociologique, les mots et les expressions ne possèdent pas toujours des significations strictement déterminées. Leur interprétation dépend fréquemment du contexte d’énonciation, du groupe social ou encore de l’intention du locuteur. Cette situation introduit une certaine imprécision sémantique et une variabilité dans l’usage des termes, phénomène que l’on peut qualifier de flou linguistique.

Par ailleurs, le chômage demeure l’un des problèmes socioéconomiques majeurs auxquels sont confrontées les populations kinoises. La précarité de l’emploi, l’insuffisance des revenus, les difficultés d’accès aux soins de santé et les mauvaises conditions de vie influencent considérablement le bien-être et l’espérance de vie des individus sans emploi.

Dans un environnement où les appréciations des conditions de vie sont souvent exprimées à travers un langage flou ou subjectif, les méthodes statistiques classiques montrent certaines limites dans l’interprétation des réalités sociales. Dès lors, le recours à la logique floue apparaît comme une approche méthodologique pertinente capable d’intégrer les dimensions qualitatives et linguistiques propres au contexte kinois. La question principale à laquelle nous tentons de répondre est formulée de manière suivante : dans quelle mesure l’application de la régression logistique binaire floue permet-elle d’estimer l’espérance de vie des chômeurs dans certaines communes de Kinshasa ?

De cette question secondaire découlent les sous-questions ci-après : (i) comment le langage linguistique flou utilisé par les populations kinoises influence-t-il l’analyse des conditions de vie des chômeurs ? (ii) quels sont les principaux facteurs socioéconomiques influençant l’espérance de vie des chômeurs à Kinshasa ? (iii) en quoi la régression logistique binaire floue constitue-telle une méthode plus adaptée que les approches classiques ?

Les hypothèses directrices de l’étude sont formulées comme suit : (i) l’intégration des variables floues issues du langage kinois améliore significativement la qualité de l’estimation de l’espérance de vie des chômeurs ; (ii) le chômage exerce un impact négatif significatif sur l’espérance de vie ; (iii) le modèle de régression logistique binaire floue est plus performant que le modèle classique dans un contexte caractérisé par des données imprécises.

L’objectif général de cette étude est d’analyser et d’estimer l’espérance de vie des chômeurs dans certaines communes de Kinshasa à l’aide de la régression logistique binaire floue en intégrant le flou linguistique kinois.

Méthodologie

La présente étude repose sur une approche quantitative fondée sur la logique floue appliquée aux sciences sociales. Contrairement aux articles statistiques classiques qui utilisent exclusivement des données numériques précises, cette recherche intègre des expressions linguistiques issues du langage courant kinois afin de représenter les réalités sociales caractérisées par l’incertitude et l’imprécision.

La philosophie méthodologique de cet article consiste donc à considérer le langage populaire comme une source de données statistiques exploitables à travers la théorie de la logique floue développée par Lotfi Zadeh. Dans ce cadre, les expressions linguistiques utilisées par les populations kinoises sont transformées en variables floues à l’aide des fonctions d’appartenance triangulaires, trapézoïdales et gaussiennes.

Cette démarche se distingue des approches classiques de régression logistique dans la mesure où les variables explicatives ne sont pas uniquement quantitatives, mais également linguistiques et subjectives. L’objectif est de mieux représenter les perceptions sociales liées au chômage, aux conditions de vie et à l’espérance de vie dans un contexte urbain marqué par l’informalité et l’incertitude.

Les données utilisées dans cette étude sont constituées d’exemples simulés inspirés des enquêtes sociales réalisées dans certaines communes de Kinshasa. Les principales variables retenues concernent notamment le niveau de la vie, niveau d’instruction, l’accès à la nourriture, l’accès aux soins, l’accès aux services sociaux de base, et l’activité professionnelle.

Après la phase de fuzzification des données linguistiques, les variables floues sont intégrées dans un modèle de régression logistique binaire floue afin d’estimer la probabilité d’appartenance des individus à une catégorie d’espérance de vie donnée. La présentation de cet article suit ainsi une logique progressive articulée autour de trois dimensions principales : (i) les fondements théoriques de la logique floue ; (ii) la transformation des expressions linguistiques kinoises en variables floues ; (iii) l’application du modèle de régression logistique binaire floue à l’estimation de l’espérance de vie des chômeurs.

Les résultats de l’étude sont déterminés avec la transformation des expressions linguistiques en variables floues, la présentation des tableaux de fuzzification ainsi que l’application du modèle de régression logistique binaire floue aux données simulées des chômeurs de Kinshasa.

C’est dans cette perspective que l’approche fondée sur la logique floue permet de mieux modéliser les situations caractérisées par l’incertitude ou l’imprécision. Ainsi, l’intégration de la régression logistique binaire dans un cadre flou constitue une approche méthodologique pertinente pour analyser des phénomènes sociaux complexes où les variables peuvent comporter un certain degré d’ambiguïté ou incertitude, notamment dans les études portant sur des populations urbaines telles que celles de Kinshasa.

Caractéristique démographique

La ville de Kinshasa, caractérisée par une forte croissance démographique et une urbanisation rapide, fait face à un taux élevé de chômage.

Une grande partie de la population active évolue dans le secteur informel, avec des conditions de vie précaires, ce qui influence directement leur état de santé et leur espérance de vie.

Dans ce contexte, l’estimation de l’espérance de vie des chômeurs devient une problématique importante pour :

Comprendre les inégalités sociales,
Orienter les politiques publiques,
Améliorer les conditions de vie.

Cependant, une particularité du milieu kinois réside dans l’usage de langage courant « Lingala », souvent caractérisé par :

Des expressions subjectives (Exemple : je me débrouille, ça ne va pas trop, un peu difficile) ;
Des perceptions imprécises des conditions de vie ;
Une absence de mesures quantitatives exactes.

Ces informations sont donc floues, qualitatives et imprécises, ce qui rend difficile leur traitement par les méthodes statistiques classiques.

Ainsi, l’étude s’inscrit dans un contexte où :

Les données sont incertaines et linguistiques ;
Les variables explicatives ne sont pas strictement numériques.

Il est nécessaire d’intégrer cette imprécision dans la modélisation.

Justification du choix du modèle (régression logistique binaire floue)

Le choix de la régression logistique binaire floue se justifie pour plusieurs raisons fondamentales :

Nature binaire de la variable dépendante

L’espérance de vie peut être modélisée sous forme binaire, par exemple.

Y={ 1: espérance de vie élevée 0: espérance de faible

La régression logistique binaire est donc appropriée pour expliquer la probabilité d’appartenir à l’une de ces catégories.

Présence du flou dans les données

Les variables explicatives issues du langage kinois ne sont pas précises :

Revenu : faible, moyen, élevé.
Condition de vie : difficile, acceptable, bonne.

Ces modalités ne sont pas numériques mais linguistiques, elles doivent être transformées en variables floues (ensembles flous).

Le modèle flou permet :

De représenter l’incertitude ;
De quantifier les perceptions subjectives ;
De conserver l’information linguistique.

Limites du modèle classique

La régression logistique classique suppose :

Des variables quantitatives précises ;
Une relation bien définie entre variables.

Donc, le modèle classique devient inadapté.

Avantages du modèle logistique flou

La régression logistique binaire floue permet :

D’intégrer des variables linguistiques ;
De transformer le langage kinois en valeurs numériques par des fonctions d’appartenance.
De modéliser l’incertitude et l’imprécision.
D’améliorer la qualité de l’estimation ;
De mieux refléter la réalité sociale du terrain.

Adaptation au contexte kinois

Ce modèle est particulièrement adapté à Kinshasa car :

Les données statistiques fiables sont rares ;
Les enquêtes reposent sur des perceptions subjectives ;
Les réalités sociales sont difficiles à quantifier de manière exacte.

Le recours à la régression logistique binaire floue se justifie par la nécessité de :

Prendre en compte la nature binaire de l’espérance de vie ;
Intégrer le flou linguistique propre au langage kinois ;
Dépasser les limites des méthodes statistiques classiques.

Ce modèle constitue ainsi un outil pertinent pour analyser des données sociales imprécises et mieux comprendre les déterminants de l’espérance de vie des chômeurs à Kinshasa.

Dans cette perspective, la régression logistique binaire floue s’impose comme une approche à la fois pertinente et novatrice, susceptible d’améliorer significativement la qualité des prédictions ainsi que la robustesse des analyses intégrant des variables issues du langage kinois, caractérisé par un certain degré de flou linguistique. Dès lors, la justification du recours à ce modèle requiert également la mobilisation des fondements théoriques de la logique floue, ainsi que la définition rigoureuse de ses concepts essentiels.

La Logique floue, introduite par Lotfi Zadeh en 1965, constitue un cadre mathématique adapté à la modélisation de l’imprécision et de l’incertitude inhérentes aux phénomènes réels.

Contrairement à la logique classique binaire, qui repose sur des valeurs strictes (0 ou 1), la logique floue permet d’attribuer à une variable un degré d’appartenance compris entre 0 et 1, traduisant ainsi des situations intermédiaires.

Dans le contexte du langage kinois, caractérisé par des expressions qualitatives telles que « un peu », « beaucoup » ou « presque rien », cette approche offre une meilleure représentation des réalités sociales et économiques. Ainsi, l’intégration de la logique floue dans la régression logistique permet de transformer ces variables linguistiques en variables quantitatives floues, rendant le modèle plus flexible et plus adapté à l’analyse des données issues d’enquêtes.

Transformation en variables floues dans un modèle statistique

1.1 ; Introduction

Dans la ville de Kinshasa, le phénomène du chômage constitue une réalité socio-économique majeure qui influence directement les conditions de vie et, par conséquent, l’espérance de vie des populations concernées dans cette étude. Toutefois, l’analyse de cette relation se heurte à plusieurs difficultés, notamment l’imprécision des données issues du langage courant des kinois.

En effet, les informations relatives au revenu, aux conditions de vie ou à la santé sont souvent exprimées de manière qualitative, subjective et floue (par exemple dire : je me débrouille « na nzo bunda », ça ne va pas « mwa muke », un peu stable « mwa ndambu ». Cette imprécision linguistique rend difficile l’application des modèles statistiques classiques, qui reposent généralement sur des données précises et quantitatives.

Dès lors, la question centrale qui se pose est la suivante :

Comment estimer de manière fiable l’espérance de vie des chômeurs dans certaines communes de Kinshasa en tenant compte du flou linguistique inhérent au langage kinois, à travers l’utilisation de la régression logistique binaire floue ?

Intégrer des variables floues issues du langage kinois améliore significativement la qualité de l’estimation de l’espérance de vie des chômeurs.

Comme le chômage a un impact négatif significatif sur l’espérance de vie des populations dans certaines communes de Kinshasa, le modèle de régression logistique binaire floue est plus performant que le modèle classique dans un contexte des données imprécises ou linguistiques.

C’est ainsi l’objectif générale est :

D’analyser et estimer l’espérance de vie des chômeurs dans certaines communes de Kinshasa à l’aide de la régression logistique binaire floue, en intégrant le flou linguistique du langage kinois.

Dans le contexte sociolinguistique de la ville de Kinshasa, certaines informations recueillies lors des enquêtes sont souvent exprimées à l’aide d’un langage courant influencé par le Lingala urbain et par des expressions populaires propres au milieu kinois. Ces expressions ne correspondent pas toujours à des catégories quantitatives précises.

Elles traduisent plutôt des perceptions approximatives ou des appréciations subjectives telles que « un peu », « beaucoup », « souvent », « rarement » ou encore des qualificatifs décrivant une situation sociale ou économique. Ce type d’information présente donc un caractère imprécis qui ne peut pas être directement traité par les méthodes statistiques classiques reposant sur des valeurs strictement déterminées. Afin de prendre en compte cette imprécision, ces expressions linguistiques peuvent être converties en variables floues dans le cadre de la logique floue.

Concrètement, chaque modalité linguistique observée dans le langage kinois est associée à une fonction d’appartenance qui traduit le degré avec lequel une observation appartient à une catégorie donnée.

Par exemple, une expression indiquant une situation économique « difficile » ou « très difficile » peut être représentée par des degrés d’appartenance compris entre 0 et 1, reflétant ainsi l’intensité ou la perception de la précarité. Une fois ces variables linguistiques transformées en variables floues, elles peuvent être intégrées dans un modèle statistique tel que la régression logistique binaire adaptée à un cadre flou.

Cette approche permet d’analyser la relation entre ces variables imprécises et la variable dépendante étudiée, par exemple l’estimation de l’espérance de vie ou certaines conditions socioéconomiques des individus. Ainsi la prise en compte du flou linguistique améliore la capacité du modèle à représenter fidèlement la réalité sociale observée dans ces enquêtes réalisées à Kinshasa.

Exemple : expressions kinoises (malembe, malembe mingi, malembe te) transformées en tableau de variables floues, dans un modèle statistique.

1.2. Expressions linguistiques dans le langage kinois

Dans les enquêtes réalisées à Kinshasa, les répondants utilisent souvent des expressions du lingala pour décrire leur situation sociale ou économique. Ces expressions ne sont pas quantitatives mais qualitatives et approximatives.

Par exemple :

Table 1 Expressions linguistiques kinoises

Expression en lingala	Signification approximative	Interprétation
Malembe te	Pas du tout lent, très rapide	Situation très favorable
Malembe	Un peu lent, moyen	Situation moyenne
Malembe mingi	Très lent	Situation défavorable

Source : Exemple illustratif sur base des données d’enquêtes.

Ces expressions traduisent une perception subjective et ne peuvent pas être directement utilisées dans une analyse statistique classique. Comment les transformées en variables floues ?

1.3. Transformation des expressions en variables floues

Pour intégrer ces informations dans une analyse basée sur la logique floue, on attribue à chaque expression un degré d’appartenance compris entre 0 et 1.

Table 2 Transformation des expressions linguistiques kinoises en variables floues

Expression en lingala	Situation très favorable	Situation moyenne	Situation défavorable
Malembe te	0,9	0,1	0,0
Malembe	0,3	0,6	0,1
Malembe mingi	0,0	0,3	0,7

Source : Exemple illustratif sur base des données d’enquêtes.

Dans ce tableau, chaque expression possède plusieurs degrés d’appartenance selon la catégorie.

Cela permet de représenter l’incertitude ou l’imprécision du langage.

1.4. Intégration dans le modèle statistique

Une fois les variables linguistiques sont transformées en valeurs floues, elles peuvent être utilisées dans un modèle tel que la régression logistique binaire dans un cadre flou. Le modèle permettra alors d’analyser l’influence de ces variables (niveau de vie, conditions sociales, situation professionnelle, etc.) sur la variable étudiée, par exemple l’espérance de vie des chômeurs dans certaines communes de Kinshasa.

1.5. Intérêt de cette approche

Cette transformation permet de prendre en compte l’imprécision du langage courant, de mieux représenter la réalité sociale observée lors des enquêtes et d’améliorer la pertinence des résultats obtenus dans les analyses statistiques appliquées aux populations urbaines de Kinshasa.

1.6. Identification des variables floues pour les chômeurs

On peut considérer plusieurs variables socio-économiques exprimées en langage kinois, qui souvent imprécis et subjectives.

Table 3 Transformation des variables floues en expressions kinoises

Variable	Modalité kinoise	Signification approximative
Niveau de vie	Malembe te	Très confortable
	Malembe	Moyennement stable
	Malembe mingi	Très précaire
Accès à la nourriture	Eza mingi	Suffisamment
	Eza naino	Insuffisant
	Eza te	Très insuffisant
Activité professionnelle	Mosala mingi	Travail stable ou plusieurs activités
	Mosala te	Pas de travail

Source : Exemple illustratif sur base des données d’enquêtes.

1.7. Transformation des variables linguistiques kinoises en variables floues

Chaque modalité est convertie en degré d’appartenance à des catégories floues ( 0 = pas du tout, 1 = complément).

Table 4 Transformation des expressions linguistiques kinoises en variables numériques floues

Variable	Modalité	Situation favorable	Situation moyenne	Situation défavorable
Niveau de vie	Malembe te	0,9	0,1	0,0
	Malembe	0,3	0,6	0,1
	Malembe mingi	0,0	0,3	0,7
Accès à la nourriture	Eza mingi	0,8	0,2	0,0
	Eza naino	0,2	0,5	0,3
	Eza te	0,0	0,2	0,8
Activité professionnelle	Mosala mingi	0,9	0,1

Source : Exemple illustratif sur base des données simulées.

Ces valeurs permettent de quantifier l’incertitude des réponses subjectives.

1.8. Intégration des variables linguistiques kinoises dans la régression logistique binaire floue

La régression logistique binaire classique se base sur :

logit(p)=ln( p 1-p )= β 0 + β 1 X 1 + β 2 X 2 +⋯+ β k X k

Dans un cadre flou, les variables deviennent des ensembles flous avec des degrés d’appartenance, on peut réécrire l’équation sous forme floue :

logit(p)=ln( p 1-p )= β ‾ 0 + β ‾ 1 X 1 + β ‾ 2 X 2 +⋯+ β ‾ k X k

Où :

— X_i = variable floue correspondant à la modalité kinoise convertie en degré d’appartenance.

— β i ̅ = coefficient flou estimé par une méthode d’approximation floue (Par exeùple extension des moindres carrés ou optimisation floue).

— p = probabilité floue que le chômeur ait une espérance de vie dans une catégorie spécifique (par exemple élevée et faible).

Exemple :

Si un chômeur X :

— Son niveau de vie est : malembe mingi et sa situation est défavorable = 0, 7

— L’accès à la nourriture est : eza naino et sa situation défavorable = 0, 3

— L’activité professionnelle : mosala te et sa situation défavorable =0, 8

Alors la variable floue combinée peut être intégrée dans le modèle pour estimer la probabilité floue p d’une espérance de vie réduite.

Prenons un cas pratique : avec 5 chômeurs fictifs, qui montre comment utiliser les variables floues dans la régression logistique binaire floue dans une étude réalisée à Kinshasa. Les données d’enquête les réponses en lingala kinois. Lors d’une enquête auprès des chômeurs parlant le lingala, on peut obtenir des réponses qualitatives comme celles-ci :

Table 5 Intégration des variables kinoises dans la régression logistique binaires floue

Individu	Niveau de vie	Accès à la nourriture	activité
Chômeur 1	Malembe mingi	Eza te	Mosala te
Chômeur 2	Malembe	Eza naino	Mosala te
Chômeur 3	Malembe te	Eza mingi	Mosala mingi
Chômeur 4	Malembe te	Eza mingi	Mosala te
Chômeur 5	Malembe mingi	Eza naino	Mosala te

Source : Exemple illustratif sur base des données simulées.

Ces réponses sont linguistiques et imprécises, donc elles doivent être transformées avec la logique floue.

1.9. Transformation en degrés d’appartenance

On doit convertir les réponses en variables flous numériques.

Table 6 Transformation des expressions kinoises en degrés d’appartenance

Individu	Niveau de vie défavorable	Nourriture insuffisante	Absence de travail
Chômeur 1	0,7	0,8	0,8
Chômeur 2	0,3	0,3	0,8
Chômeur 3	0,0	0,0	0,0
Chômeur 4	0,1	0,0	0,8
Chômeur 5	0,7	0,3	0,8

Source : Exemple illustratif sur base des données simulées.

Ces variables représentent le degré d’appartenance à une situation socio-économique défavorable.

1.10. Variable dépendante (y)

Dans notre étude, on peut considérer y = 1 est l’espérance de vie fiable et y = 0 est l’espérance de vie relativement élevée.

On a :

Table 7 Variable dépendante

Individu	Espérance de vie
Chômeur 1	1
Chômeur 2	1
Chômeur 3	0
Chômeur 4	0
Chômeur 5	1

Source : Exemple illustratif sur base des données simulées.

Nous pouvons présenter le modèle de régression logistique binaire floue de note étude.

On applique la régression logistique binaire :

logit(p)= β 0 + β 1 X 1 + β 2 X 2 +⋯+ β 3 X 3

Où :

X₁ = Niveau de vie défavorable
X₂ = Insuffisance alimentaire
X₃ = Absence d’activité

On a des coefficients estimés :

X₁ = Niveau de vie défavorable
X₂ = Insuffisance alimentaire
X₃= Absence d’activité
β₀ = −1, 2
β₁ = 2, 1
β₂ = 1, 6
β₃ = 1, 8

Calculons pour le chômeur

X₁= 0, 7
X₂= 0, 8
X₃= 0, 8

Remplaçons les valeurs dans la formule :

Logit(p) = −1, 2 + 2, 1(0, 7) + 1, 6(0, 8) + 1, 8(0, 8)

Logit(p) = −1, 2 + 1, 47 + 1, 28 + 1, 44

Logit(p) = 2, 99

La probabilité p :

p= 1 1+ e -2,99

p ≈ 0, 95 faible, cela signifie qu’il y a 95% de probabilité que ce chômeur appartient à la catégorie d’espérance de vie.

Présentation du langage kinois

Pour présenter le langage kinois comme « na salaka mosala te » je ne travaille pas (chômeur) et « na salaka mosala » (je travaille) en forme floue, on utilise la théorie de la logique floue développée par Lotfi Zadeh.

Le principe est de transformer une expression linguistique imprécise en fonction d’appartenance comprise entre 0 et 1. Dans notre étude sur la régression logistique binaire floue, ces expressions peuvent être transformées en variables linguistiques floues.

2.1. Transformation du langage kinois en variable floue.

Variable linguistique : statut d’emploi

Modalités linguistiques : « na salaka mosala te » ça signifie le chômage élevé
« na sala mosala malembe » ça signifie emploi précaire
« na salaka mosala » ça signifie emploi stable

On définit une variable quantitative :

X = nombre d’heures de travail par semaine.

2.2. Représentation des fonctions d’appartenance

2.2.1. Fonction triangulaire

Une fonction triangulaire est définie par trois paramètres : (a, b, c)

a = début
b = sommet (appartenance = 1)
c = fin

17

Table 8 Représentation des expressions kinoises sous forme triangulaire

Langage kinois	Fonction triangulaire
Na salaka mosala te	(0, 0, 10)
Mosala malembe	(5, 20, 25)
Na salaka mosala	(30, 45, 60)

Source : Exemple illustratif sur base des données simulées.

Fonction (x)={ 0 si x<a, x-a b-a si a≤x≤b, c-x c-b si b≤x≤c, 0 si x>c.

Nous pouvons interpréter :

0 à 10 heures : na salaka mosala te.
20 à 35 heures : travail moyen.
40 à 60 heures : na salaka mosala.

2.2.2. Fonction trapézoïdale

La fonction trapézoïdale est définie par (a, b, c, d) où l’appartenance est 1 entre b et c.

Source : Exemple illustratif sur base des données simulées.

La forme trapézoïdale représente mieux les zones stables.

2.2.3. Fonction gaussienne (plus lisse)

U(x)= e - x-c 2 σ 2

Où :

c = centre
σ = Dispersion

Cette forme est souvent utilisée dans les modèles statistiques car elle est continue et stable.

2.3. Fructification (fuzzification) du langage kinois

La fuzzification consiste à transformer la phrase linguistique en degré d’appartenance.

Si l’individu travaillant 15 heures par semaine.

Table 9 Transformation des expressions en degré d’appartenance

Expression	Degré flou
Na salaka mosala te	0,6
Mosala malembe	0,4
Na salaka mosala	0

Source : Exemple illustratif sur base des données simulées.

Donc la personne est partiellement chômeur et partiellement actif.

L’intégration dans la régression logistique binaire floue dans notre modèle :

p(y=1)= 1 1+ e -( β 0 + β 1 X 1 + β 2 X 2 )

Les variables X_ideviennent : X_i= u_i(x)

Où u est la fonction floue correspondant au langage kinois.

Na salaka mosala te : variable floue (chômage)

Na salaka mosala : variable floue (emploi)

Le langage kinois peut être transformé en variables floues par :

— la forme triangulaire simple et intuitive.

— la forme trapézoïdale par des zones stables.

— la forme gaussienne qui est adaptée aux modèles statistiques.

Cela permet d’intégrer l’incertitude linguistique du langage kinois dans la régression logistique binaire floue pour estimer par exemple l’espérance de vie des chômeurs à Kinshasa.

Exemple d’un tableau de 10 expressions du langage kinois transformées en variables floues.

Table 10 Transformation (fuzzification) des expressions en fonctions triangulaire, trapézoïdale et gaussienne

Expression kinoise	Signification	Variable floue	Forme triangulaire	Forme trapézoïde	Forme gaussien
Na salaka mosala te	Je ne travaille pas	Chômage total	(0, 0, 10)	(0, 0, 5, 10)	(5, 3)
Na zangi mosala	Manque d'emploi	Chômage élevé	(0, 5, 10)	(0, 5, 10, 15)	(8, 4)
Na zali koluka mosala	Recherche d'emploi	Recherche d'emploi	(5, 15, 25)	(5, 10, 20, 25)	(15, 5)
Mosala ya tango moke	Travail temporaire	Emploi temporaire	(10, 20, 30)	(10, 15, 25, 30)	(20, 6)
Mosala malembe	Travail faible	Emploi précaire	(15, 25, 35)	(15, 20, 30, 35)	(25, 6)
Mosala mokolo ya mokolo na mokolo	Travail journalier	Emploi journalier	(20, 30, 40)	(20, 25, 35, 40)	(30, 6)
Mosala ya contrat	Travail sous contrat	Emploi contractuel	(25, 35, 45)	(25, 30, 40, 45)	(35, 7)
Na salaka mosala mikolo ya kopona	Travail irrégulier	Emploi irrégulier	(30, 40, 50)	(30, 35, 45, 50)	(40, 7)
Na salaka mosala malamu	Travail stable	Emploi stable	(35, 45, 55)	(35, 40, 50, 55)	(45, 8)
Na salaka mosala malamu penza	Travail très stable	Emploi très stable	(40, 50, 60)	(40, 45, 55, 60)	(50, 8)

Source : Exemple illustratif sur base des données simulées.

La variable quantitative utilisée x est le nombre d’heures de travail par semaine.

2.4. Représentation graphiques des formes floues des variables linguistiques kinoises

Ces graphiques montrent comment les expressions du langage kinois sont transformées en degrés d’appartenance entre 0 et 1, selon la théorie de Lotfi Zadeh.

La Fonction d’appartenance triangulaire.

**Figure 1** Fonctions d’appartenance triangulaires pour les variables floues liées aux situations d’emploi à Kinshasa

La fonction d’appartenance trapézoïde.

**Figure 2** Fonctions d’appartenance triangulaires pour les variables floues liées aux situations d’emploi à Kinshasa

La fonction d’appartenance gaussienne.

**Figure 3** Fonctions d’appartenance triangulaires pour les variables floues liées aux situations d’emploi à Kinshasa

2.5. Tableau des variables floues intégrées dans la régression logistique

Variable dépendante y =

Variable dépendante y={ 1 ( espérance de vie élevée ), 0 ( espérance de vie faible ).

Table 11 Variables floues intégrées dans la régression logistique

Expression kinoise	Variable linguistique	Variable floue x	Fonction floue	paramètres
Na salaka mosala te	Chômage total	$x_1$	Triangulaire	(0, 0, 10)
Na zangi mosala	Chômage élevé	$x_2$	Trapézoïdale	(0, 5, 10, 15)
Na zali koluka mosala	Recherche d'emploi	$x_3$	Triangulaire	(5, 15, 25)
Mosala ya tango moke	Travail temporaire	$x_4$	Gaussienne	(20, 6)
Mosala ya tango moke	Emploi précaire	$x_5$	Trapézoïdale	(15, 20, 30, 35)
Mosala ya mokolo na mokolo	Emploi journalier	$x_6$	Triangulaire	(20, 30, 40)
Mosala ya contrat	Emploi contractuel	$x_7$	Gaussienne	(35, 7)
Na salaka mosala mikolo ya kopona	Travail irrégulier	$x_8$	Triangulaire	(30, 40, 50)
Na salaka mosala malamu	Emploi stable	$x_9$	Trapézoïde	(35, 40, 50, 55)
Na salaka mosala mingi	Emploi très stable	$x_{10}$	Gaussienne	(50, 8)

Source : Exemple illustratif sur base des données simulées.

Chaque variable xi est remplacé par une fonction d’appartenance :

X i = μ i (x)

En intégrant dans la régression logistique binaire floue le modèle devient :

p(y=1)= 1 1+ e -( β ‾ 0 + β ‾ 1 μ 1 (x)+ β ‾ 2 μ 2 (x)+⋯+ β ‾ 10 μ 10 (x))

Où :

β₀ = constante
β_i= Coefficients estimés
u_i(x) = degré d’appartenance floue

Discussion des résultats

Les résultats obtenus dans cette étude montrent que l’intégration des expressions linguistiques kinoises dans un modèle de régression logistique binaire floue permet de mieux représenter les réalités sociales caractérisées par l’incertitude et l’imprécision.

Contrairement aux modèles statistiques classiques fondés exclusivement sur des données numériques précises, l’approche floue utilisée dans cette recherche tient compte des perceptions subjectives exprimées à travers le langage courant des populations kinoises. Les expressions telles que « malembe mingi », « eza te » ou encore « na salaka mosala te » traduisent des réalités sociales intermédiaires difficiles à quantifier dans un cadre statistique traditionnel.

Les résultats illustratifs montrent également que les variables relatives au niveau de vie, à l’accès à la nourriture et à l’activité professionnelle influencent significativement la probabilité d’appartenance à une catégorie d’espérance de vie faible.

L’application des fonctions d’appartenance triangulaires, trapézoïdales et gaussiennes a permis de transformer les données qualitatives en variables numériques floues exploitables dans le modèle de régression logistique binaire.

Par ailleurs, l’étude met en évidence l’intérêt méthodologique de la logique floue dans les recherches socio-statistiques réalisées dans les contextes urbains africains caractérisés par une forte informalité linguistique et économique.

Cependant, les résultats obtenus demeurent illustratifs dans la mesure où l’étude repose principalement sur des données simulées. Une validation empirique à grande échelle à partir des enquêtes réelles permettrait de renforcer davantage la robustesse statistique du modèle proposé.

Recommandations

Au regard des résultats obtenus, plusieurs recommandations peuvent être formulées :

(i) Encourager l’utilisation de la logique floue dans les études socio-statistiques portant sur des données caractérisées par l’incertitude linguistique ;

(ii) Développer des bases de données sociolinguistiques adaptées aux réalités urbaines de Kinshasa ;

(iii) Intégrer les variables linguistiques dans les modèles statistiques appliqués aux phénomènes sociaux complexes ;

(iv) Renforcer les recherches interdisciplinaires associant statistique, sociolinguistique et intelligence artificielle ;

(v) Réaliser des enquêtes empiriques à grande échelle afin de tester la performance du modèle proposé sur des données réelles ;

(vi) Promouvoir l’utilisation des approches floues dans les études relatives au chômage, à la pauvreté et aux conditions de vie en milieu urbain africain.

Conclusion

Cette étude avait pour objectif principal d’appliquer la régression logistique binaire floue à l’estimation de l’espérance de vie des chômeurs dans certaines communes de Kinshasa en intégrant le flou linguistique du langage kinois.

Les résultats obtenus montrent que les expressions linguistiques utilisées dans les enquêtes sociales peuvent être transformées en variables floues à travers des fonctions d’appartenance triangulaires, trapézoïdales et gaussiennes. Cette transformation permet d’intégrer des informations qualitatives et subjectives dans un modèle statistique.

L’approche fondée sur la logique floue apparaît ainsi particulièrement pertinente pour analyser les réalités sociales complexes caractérisées par l’incertitude et l’imprécision linguistique.

Toutefois, cette étude présente certaines limites liées au caractère illustratif des données utilisées. Des recherches futures pourraient s’appuyer sur des enquêtes empiriques plus larges afin de renforcer la validité statistique du modèle proposé.

References

Boye, S., Hajdenberg, J., et Poursat, C. (2006). Le guide de la microfinance : Microcrédit et épargne pour le développement. Éditions d’Organisation. DOI ↗ Google Scholar ↗
Ravallion, M. (2009). Poverty analysis. In T.P. Schultz et J. Strauss (Eds.), Handbook of development economics (Vol. 4, pp. 2475-2578). Elsevier. DOI ↗ Google Scholar ↗
Rawls, J., et Sen, A. (2009). Théories de la justice et du développement. Presses Universitaires de France. DOI ↗ Google Scholar ↗
Paugam, S. (1995). Les formes élémentaires de la pauvreté. Presses Universitaires de France. DOI ↗ Google Scholar ↗
Mollat, M. (1978). Les pauvres au Moyen Âge : étude sociale. Hachette. DOI ↗ Google Scholar ↗
Zadeh, L. A., (1965). Fuzzy sets. Information and control, 8(3), 338-353. DOI ↗ Google Scholar ↗

[ref-R1] Boye, S., Hajdenberg, J., et Poursat, C. (2006). Le guide de la microfinance : Microcrédit et épargne pour le développement. Éditions d’Organisation. DOI ↗ Google Scholar ↗

[ref-R2] Ravallion, M. (2009). Poverty analysis. In T.P. Schultz et J. Strauss (Eds.), Handbook of development economics (Vol. 4, pp. 2475-2578). Elsevier. DOI ↗ Google Scholar ↗

[ref-R3] Rawls, J., et Sen, A. (2009). Théories de la justice et du développement. Presses Universitaires de France. DOI ↗ Google Scholar ↗

[ref-R4] Paugam, S. (1995). Les formes élémentaires de la pauvreté. Presses Universitaires de France. DOI ↗ Google Scholar ↗

[ref-R5] Mollat, M. (1978). Les pauvres au Moyen Âge : étude sociale. Hachette. DOI ↗ Google Scholar ↗

[ref-R6] Zadeh, L. A., (1965). Fuzzy sets. Information and control, 8(3), 338-353. DOI ↗ Google Scholar ↗